O projeto foi elaborado por 4 estudantes do curso de Bacharelado em Ciência e Tecnologia, da ILUM - Escola de ciências, sendo eles:
- Pedro Henrique Sophia;
- João Pedro Aroucha de Brito;
- Pedro Thomazelli Ferreira;
- Victor Puntel Rui.
- Coleta dos dados, de modo a selecionar aqueles que mais se adequassem à realização da previsão;
- Preparação dos dados, que consiste no mensuramento, caracterização e filtragem, de modo a definir um melhor conjunto para o modelo;
- Análise dos dados, seguida de uma discussão para concluir se os dados escolhidos resultaram como esperado;
- Análise sobre as estatísticas descritivas dos dados, a fim de encontrar a covariância das diferentes features - características que terão influência na previsão do modelo.
- Divisão dos dados em treino e teste, para o desenvolvimento de uma baseline;
- Identificação e escolha dos hiperparâmetros, para que fosse possível fazer um modelo de "k" vizinhos mais próximos, fazendo sua avaliação e estudando seu desempenho;
- Execução da regressão linear, primeiramente sem normalização, seguido pelo modelo normalizado, além da avaliação de ambos;
- Escolha dos hiperparâmetros de acordo com a intuição, treinando um modelo de árvore de decisão, com base no dataset de treino, seguida pela avaliação;
- Alteração da complexidade do modelo, etudando seu desempenho de acordo com isso;
- Esboço da árvore de decisão;
- Agora, identifica-se os hiperparâmetros para o modelo de floresta aleatória, seguida pela avaliação do mesmo, mudando sua complexidade, tal qual foi feito anteriormente;
- Escolha do melhor hiperparâmetro;
- Comparação do desempenho dos modelos obtidos;
- Escolha de um algoritmo para sua classificação, hiperparâmetros, usando intuição, para terinamento do modelo e, por fim, avaliação do desempenho.
- Redução de dimensionalidade e aplicação de PCA (análise de componente principal);
- Clustering, para encontrar grupos semelhantes;
- Detecção de outliers para melhor entendimento dos resultados obtidos, utilizando as técnicas:
- LOF;
- Insolation Forest.