COMPARAÇÃO DE ESTRATÉGIAS E MONTADORES DE TRANSCRIPTOMA PARA ANÁLISE DE RNA-SEQ DE Leishmania |
O Sequenciamento de RNA (RNA-seq) é uma tecnologia inovadora que tem possibilitado analisar transcriptomas com acurácia e robustez. Algumas espécies de Leishmania , os agentes causadores das leishmanioses, têm sido analisadas utilizando RNA-seq, entretanto, a maioria destas análises tem sido baseadas em estratégias de montagem por referência, o que pode limitar ou enviesar o resultado a depender da qualidade do genoma de referência utilizado. Na ausência de um genoma de referência bem anotado, dados de RNA-seq podem ser montados de novo utilizando softwares de bioinformática. Com o objetivo de padronizar estratégias para montagem de novo de RNA-seq de Leishmania , nós comparamos seis softwares montadores e cinco pipelines de pré-processamento de dados para analisar o RNA-seq da Leishmania infantum (cepa Teresina), o principal agente causador da leishmaniose visceral no Novo Mundo. Transcritos montados com comprimento >500 e >1000 pb, cobertura do bando de dados, isoforma 95%-montada e porcentagem de reads utilizados para a montagem (%RUM) foram escolhidos como critérios para avaliação. Em relação ao comprimento dos transcritos montados, cobertura do banco de dados e isoforma 95%-montada, o pipeline zero (P0) mostrou os melhores resultados. Em relação aos montadores, rnaSPAdes mostrou os melhores resultados para cobertura do banco de dados e isoforma 95%-montada, enquanto que IDBA-tran se sobressaiu em relação aos transcritos montados >500 e 1000 pb. No critério %RUM, o montador Trinity foi o melhor. Nossas análises servirão de base para futuros estudos, auxiliando usuários inexperientes a escolher qual melhor software de montagem e qual melhor estratégia de pré-processamento de dados de RNA-seq de acordo com seus próprios objetivos. |