O projeto tem por objetivo, baseado nas características quantitativas do dataset, fazer uma análise visual desses atributos e propor um modelo de regressão. O resultado esperado é um modelo o qual faz previsões dos preços das casas baseadando-se nas características desejadas pelo cliente.
matplotlib==3.6.0
numpy==1.23.3
pandas==1.5.0
scikit-learn==1.1.2
seaborn==0.12.0
statistics==1.0.3.5
Etapa dedicada a diagnósticar os dados faltantes e/ou sujos
e também seleção de features mais relevantes para aplicar
Machine Learning.
Cada um dos dados foi gravado como sendo string ou 'object',
portanto, cada uma das features selecionadas precisa de um
tratamento para um formato numérico adequado.
Nessa etapa, os dados serão plotados para se extrair informações
valiosas a respeito de seus comportamentos e variações.
Essa etapa também será fundamental para identificar elementos
e medidas necessárias para que a aplicação de Machine Learning
tenha resultados satisfatórios.
Após tratar, vizualizar e selecionar os dados, chegou o momento
de usá-los para criar um bom modelo de Machine Learning. Nesse
sentido, vários modelos foram testados usando diferentes métricas
e técnicas para avaliar o desempenho de cada estratégia de regressão
(no presente trabalho foram usadas regressão linear, polinomial,
árvore de decisão e floresta aleatória) tais como validação cruzada
e métricas como R², MSE e MSA.