COMPARAÇÃO DE ESTRATÉGIAS E MONTADORES DE TRANSCRIPTOMA PARA ANÁLISE DE RNA-SEQ DE Leishmania
LUCAS CHRISTIAN DE SOUSA-PAULA 1,2, WILSON JOSÉ DA SILVA JÚNIOR1,2, RAUL MAIA FALCÃO1,2, SÉRGIO DE SÁ LEITÃO PAIVA JÚNIOR1,2, VALERIA CLAUDIANE SIMEÃO OLIVEIRA1,2, VLADMIR COSTA SILVA1,2, VALDIR DE QUEIROZ BALBINO1,2, CARLOS HENRIQUE NERY COSTA1,2
1. IAM / FIOCRUZ PE - Instituto Aggeu Magalhães / Fundação Oswaldo Cruz, 2. LABBE / UFPE - Laboratório de Bioinformática e Biologia Evolutiva / Universidade Federal de Pernambuco, 3. IDTNP / UFPI - Instituto de Doenças Tropicais Natan Portella / Universidade Federal do Piauí
lcsousapaula@gmail.com

O Sequenciamento de RNA (RNA-seq) é uma tecnologia inovadora que tem possibilitado analisar transcriptomas com acurácia e robustez. Algumas espécies de Leishmania , os agentes causadores das leishmanioses, têm sido analisadas utilizando RNA-seq, entretanto, a maioria destas análises tem sido baseadas em estratégias de montagem por referência, o que pode limitar ou enviesar o resultado a depender da qualidade do genoma de referência utilizado. Na ausência de um genoma de referência bem anotado, dados de RNA-seq podem ser montados de novo utilizando softwares de bioinformática. Com o objetivo de padronizar estratégias para montagem de novo de RNA-seq de Leishmania , nós comparamos seis softwares montadores e cinco pipelines de pré-processamento de dados para analisar o RNA-seq da Leishmania infantum (cepa Teresina), o principal agente causador da leishmaniose visceral no Novo Mundo. Transcritos montados com comprimento >500 e >1000 pb, cobertura do bando de dados, isoforma 95%-montada e porcentagem de reads utilizados para a montagem (%RUM) foram escolhidos como critérios para avaliação. Em relação ao comprimento dos transcritos montados, cobertura do banco de dados e isoforma 95%-montada, o pipeline zero (P0) mostrou os melhores resultados. Em relação aos montadores, rnaSPAdes mostrou os melhores resultados para cobertura do banco de dados e isoforma 95%-montada, enquanto que IDBA-tran se sobressaiu em relação aos transcritos montados >500 e 1000 pb. No critério %RUM, o montador Trinity foi o melhor. Nossas análises servirão de base para futuros estudos, auxiliando usuários inexperientes a escolher qual melhor software de montagem e qual melhor estratégia de pré-processamento de dados de RNA-seq de acordo com seus próprios objetivos.



Palavras-chaves:  Leishmania infantum, Montagem de novo, Sequenciamento de nova geração