Este repositório contém um notebook interativo que demonstra técnicas de análise de dados e machine learning em um conjunto de dados de carros. O notebook faz parte de um tutorial projetado para o Bootcamp TPD, focando em fornecer experiência prática com ferramentas e métodos de ciência de dados.
-
dataset-carros.ipynb
: Um notebook Jupyter interativo que guia você através do processo de:- Carregamento e exploração do conjunto de dados de carros (
cars.csv
) - Realização de análise exploratória de dados (EDA)
- Pré-processamento dos dados para modelagem
- Construção e avaliação de modelos preditivos
- Carregamento e exploração do conjunto de dados de carros (
-
cars.csv
: O conjunto de dados usado no notebook, contendo várias características de carros, como milhas por galão (mpg), número de cilindros, deslocamento do motor, potência, peso, tempo de aceleração, ano do modelo e origem.
Para executar o notebook, você precisa ter o seguinte instalado:
- Python 3.x
- Jupyter Notebook
- Pandas
- Scikit-learn
- Matplotlib
- Seaborn
Você pode instalar os pacotes necessários usando o seguinte comando:
pip install pandas scikit-learn matplotlib seaborn