INTEGRAÇÃO E MINERAÇÃO VISUAL DE DADOS PARA ESTUDO DA MALÁRIA NO BRASIL
MARCOS ENNES BARRETO1, JURACY BERTOLDO1, ALBERTO PIETRO SIRONI 1
1. UFBA - Universidade Federal da Bahia
marcosebarreto@gmail.com

Técnicas de integração e visualização de dados têm sido largamente empregadas na pesquisa científica para permitir a exploração de grandes volumes de dados e o apoio a processos de tomada de decisão. A integração permite que dados provenientes de diferentes fontes sejam combinados para a formação de uma única base de dados agregando diversas variáveis de interesse para diferentes tipos de análises e estudos. A visualização permite que grandes e complexos conjuntos de dados possam ser manipulados e interpretados de forma mais intuitiva, através de diferentes técnicas e recursos visuais que sintetizam as principais características e padrões encontrados nestes dados. Neste trabalho, técnicas de integração e visualização foram aplicadas em dados provenientes do ecossistema brasileiro de vigilância de malária para i) construir uma base integrada de dados de monitoramento e notificação de casos e ii) permitir o desenvolvimento de modelos de predição de epidemias. Este trabalho objetivou a integração de dados provenientes do SIVEP-Malária (Sistema de Informação de Vigilância Epidemiológica), do SINAN-Malária (Sistema de Informação de Agravos de Notificação) e do SIM-Malária (Sistema de Informações de Mortalidade) a dados climáticos e socioeconômicos para servirem de base ao desenvolvimento de modelos preditivos de epidemias. Técnicas de integração probabilística de dados foram empregadas para permitir a integração destas bases, enquanto métodos de visualização foram usados para permitir a análise exploratória e apresentação de resultados. Foram analisados dados do SIVEP, SINAN e SIM com 885, 1473, 671 municípios respectivamente para o período de 2003 a 2015. Inicialmente foi analisado a qualidade da bases originais, com a verificação da completude e da acurácia dos campos. As bases de dados individuais foram transformada para nível municipal para cada ano. Para explorar e interpretar os dados foram utilizados gráficos para representar relações entre atributos, gráficos de barras, de torta e histograma de frequência. A integração das bases de dados e a criação de uma base nacional de malária é importante para melhor planejamento, vigilância e controle da malária. Este processo vai permitir a análise da patologia em conjunto com dados climáticos e socioeconômicos. A criação de uma plataforma de visualização e mineração de dados irá contemplar a possibilidade de manipular os dados, analisá-lo e visualizá-lo, possibilitando análise preditiva e novas descobertas.



Palavras-chaves:  Malária, Integração, Visualização, Análise Preditiva