/AstroAPI

Asteroid datamining

Primary LanguageJupyter NotebookGNU General Public License v3.0GPL-3.0

Previsão de temperatura

Um estudo acima do comportamento climático de diversas regiões do globo

Descrição

O projeto tem como objetivo prever três características climáticas em qualquer latitude do globo (utilizando a API fornecida pelo site WeatherStack), fixa a uma longitude de 20°, com base nos dados fornecidos por um limitado número de estações meteorológicas dispostas latitudinalmente. Torna-se possível dispor graficamente e aplicar uma regressão polinomial para descrever o comportamento da temperatura, sensação térmica e descrição do clima, para que seja possível prever a determinada característica de maneira precisa.

O projeto foi elaborado por 4 estudantes do curso de Bacharelado em Ciência e Tecnologia, da ILUM - Escola de ciências, sendo eles:

  • Pedro Henrique Sophia;
  • João Pedro Aroucha de Brito;
  • Pedro Thomazelli Ferreira;
  • Victor Puntel Rui.

O processo

Bloco 1

  • Coleta dos dados, de modo a selecionar aqueles que mais se adequassem à realização da previsão;
  • Preparação dos dados, que consiste no mensuramento, caracterização e filtragem, de modo a definir um melhor conjunto para o modelo;
  • Análise dos dados, seguida de uma discussão para concluir se os dados escolhidos resultaram como esperado;
  • Análise sobre as estatísticas descritivas dos dados, a fim de encontrar a covariância das diferentes features - características que terão influência na previsão do modelo.

Bloco 2

  • Divisão dos dados em treino e teste, para o desenvolvimento de uma baseline;
  • Identificação e escolha dos hiperparâmetros, para que fosse possível fazer um modelo de "k" vizinhos mais próximos, fazendo sua avaliação e estudando seu desempenho;
  • Execução da regressão linear, primeiramente sem normalização, seguido pelo modelo normalizado, além da avaliação de ambos;
  • Escolha dos hiperparâmetros de acordo com a intuição, treinando um modelo de árvore de decisão, com base no dataset de treino, seguida pela avaliação;
  • Alteração da complexidade do modelo, etudando seu desempenho de acordo com isso;
  • Esboço da árvore de decisão;
  • Agora, identifica-se os hiperparâmetros para o modelo de floresta aleatória, seguida pela avaliação do mesmo, mudando sua complexidade, tal qual foi feito anteriormente;
  • Escolha do melhor hiperparâmetro;
  • Comparação do desempenho dos modelos obtidos;
  • Escolha de um algoritmo para sua classificação, hiperparâmetros, usando intuição, para terinamento do modelo e, por fim, avaliação do desempenho.

Bloco 3

  • Redução de dimensionalidade e aplicação de PCA (análise de componente principal);
  • Clustering, para encontrar grupos semelhantes;
  • Detecção de outliers para melhor entendimento dos resultados obtidos, utilizando as técnicas:
    • LOF;
    • Insolation Forest.

Bloco 4

⚠️ Projeto em andamento ⚠️

Resultados