Nanodegree Engenheiro de Machine Learning
Modelo de avaliação e validação
Projeto: Prevendo o preço de imóveis de Boston
Instalação
Este projeto requer Python 3 e as seguintes bibliotecas Python:
Você também precisará ter software instalado para rodar e executar um Jupyter Notebook
Se você ainda não tem o Python instalado, é altamente recomendado que instale a distribuição Anaconda, que já tem os pacotes acima incluídos. Certifique-se de selecionar o instalador Python 2.7, não o 3.x.
Código
Um modelo do código é fornecido no arquivo notebook boston_housing_PT.ipynb
. Você também precisará usar o arquivo Python visuals.py
e o arquivo de dados housing.csv
para completar seu trabalho. Mesmo que parte do código já tenha sido fornecida para ajudá-lo a começar, você precisará implementar funcionalidades adicionais em alguns pontos para conseguir completar o projeto com sucesso. Note que o código incluído em visuals.py
foi feito para ser utilizado do jeito que está, sem manipulação por parte dos estudantes. Mas, se você estiver interessado em saber como as visualizações são criadas no notebook, fique à vontade para explorar esse arquivo Python.
Execução
Em um terminal ou janela de comando, navegue até o diretório raiz de projeto boston_housing/
(que contém este README) e execute os seguintes comandos:
ipython notebook boston_housing_PT.ipynb
ou
jupyter notebook boston_housing_PT.ipynb
Isso abrirá o o software e arquivo de projeto Jupyter Notebook em seu navegador.
Dados
O conjunto de dados do mercado imobiliário de Boston consiste em 489 pontos de dados, sendo que cada ponto possui 3 atributos. Este conjunto de dados é uma versão modificada do conjunto de dados do mercado imobiliário de Boston encontrado no Repositório de machine learning da UCI.
Atributos
RM
: número médio de cômodos por casaLSTAT
: porcentagem da população considerada de baixa rendaPTRATIO
: razão estudante/professor da cidade
Variável alvo
MEDV
: valor mediano das casas