-
Pandas: Para explorar e fazer a leitura dos dados
-
Matplotlib: Para a visulização dos dados
-
Scikit-Learn: Para a criação do modelo
-
Numpy: Para manipulação dos dados
-
[yellowbrick] (https://www.scikit-yb.org/en/latest/): Para seleção de variáveis
Para instalar as bibliotecas você pode digitar no terminal:
pip install nome_pacote
Por exemplo:
pip install pandas
Atualmente o projeto está dividido assim:
- train.csv e test.csv: dados usados para treino do modelo
- Predição de usuários de bike.ipynb: contém o código construído.