/Lyncis-IA

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

Lyncis-IA

Projeto elaborado para o estudo analítico (desenvolvido com Machine Learning) de dados anamnéticos sobre casos de malária relacionados à Amazônia Legal.

Os dados utilizados para o desenvolvimento desse projeto foram extraídos de um repositório da Synapse, An Integrated Dataset of Malaria Notifications in the Legal Amazon. À vista disso, foi desenvolvido um mecanismo probabilístico, o qual visa mensurar a taxa de infecção por Plasmodium sp. quando se visita ou mora em algum dos munícipios documentados.

por Guilherme Gurian Dariani, Shaian José Anghinoni e Gustavo Duarte Verçosa.

Descrição dos arquivos

  • Pasta “dados”: contém todos os dados necessários para o estudo.
    • Arquivo ".gitignore": utilizado para designar arquivos e diretórios ignorados;
    • Arquivo "LICENSE": usado para compartilhar software de código aberto;
    • Arquivo "README.md": apresenta informações do projeto, é o que está lendo agora;
    • Arquivo "grafico.png": feito para uma análise preliminar de todos os dados;
    • Arquivo "importar_exportar.py": trata previamente os dados com tamanho reduzido e exporta o arquivo para o modelo pickle, ao invés do csv (a fim de ser mais rápido). Possui "Dados_utilizaveis", que contêm o código dos munícipios do Brasil e os dados de latitude e longitude respectivos, sendo então as informações utilizadas para elaborar o estudo de Machine Learning;
    • Arquivo "manipulacao_dados.py": termina de tratar os dados e plota a chance mínima de alguém contrair malária em cada mês (variando os anos), comparado com a somatória da população dos municípios que teve a infecção;
    • Arquivo "matriz_covariancia.png": análise da interligação entre meses;
    • Arquivo "requerimentos.txt": são todas as bibliotecas instaladas e, portanto, utilizadas, tais como: Numpy, Pandas, SciKit-Learn;
    • Arquivo "treino.ipynb": desenvolvimento prático da análise probabilística;
    • Arquivo "unsupervised.ipynb": estudo de modelos não supervisionados, algoritmos PCA e dados anômalos.