Projeto elaborado para o estudo analítico (desenvolvido com Machine Learning) de dados anamnéticos sobre casos de malária relacionados à Amazônia Legal.
Os dados utilizados para o desenvolvimento desse projeto foram extraídos de um repositório da Synapse, An Integrated Dataset of Malaria Notifications in the Legal Amazon. À vista disso, foi desenvolvido um mecanismo probabilístico, o qual visa mensurar a taxa de infecção por Plasmodium sp. quando se visita ou mora em algum dos munícipios documentados.
- Pasta “dados”: contém todos os dados necessários para o estudo.
- Arquivo ".gitignore": utilizado para designar arquivos e diretórios ignorados;
- Arquivo "LICENSE": usado para compartilhar software de código aberto;
- Arquivo "README.md": apresenta informações do projeto, é o que está lendo agora;
- Arquivo "grafico.png": feito para uma análise preliminar de todos os dados;
- Arquivo "importar_exportar.py": trata previamente os dados com tamanho reduzido e exporta o arquivo para o modelo pickle, ao invés do csv (a fim de ser mais rápido). Possui "Dados_utilizaveis", que contêm o código dos munícipios do Brasil e os dados de latitude e longitude respectivos, sendo então as informações utilizadas para elaborar o estudo de Machine Learning;
- Arquivo "manipulacao_dados.py": termina de tratar os dados e plota a chance mínima de alguém contrair malária em cada mês (variando os anos), comparado com a somatória da população dos municípios que teve a infecção;
- Arquivo "matriz_covariancia.png": análise da interligação entre meses;
- Arquivo "requerimentos.txt": são todas as bibliotecas instaladas e, portanto, utilizadas, tais como: Numpy, Pandas, SciKit-Learn;
- Arquivo "treino.ipynb": desenvolvimento prático da análise probabilística;
- Arquivo "unsupervised.ipynb": estudo de modelos não supervisionados, algoritmos PCA e dados anômalos.