Projeto Stack Labs do time koalas apresentado no dia 27/01/2022 Integrantes: Clarice Satiko Aoto, Isis Souza, Marcos Costa, Octavio Oliveira e Peterson Silva
No corpo da pasta principal há os principais arquivos utilizados no processo.
- 20220126_MAQUINA_PREDITIVA.ipynb: traz o código utilizado para Machine Learning
- 20220126tratamentoDadosNLP.ipynb: traz o código de tratamento NLP, alguns insights e um teste de modelos para ML
- Koalas01_ipynb: é uma versão antiga que não foi usada no fim, mas que possui muitos códigos que foram importantes no desenvolvimento final, além de ter gerado o arquivo que foi trabalhado na análise exploratória
- analise_exploratoria.ipynb: traz o código com insights na exploração dos dados (há mais alguns no Power BI, visto que a análise exploratória ocorreu em dois ambientes)
- olist_processado.parquet: é um arquivo utilizado nos códigos
- olist_processado.parquet2: outro arquivo utilizado nos códigos
As demais pastas são compostas por material de apoio aos principais:
- JPEG: Contém todos os arquivos JPEG utilizado nos códigos
- Olist_map: Contém todos os csv segmentados segundo foco do grupo e os Shapefiles criados no QGIS
- PNG: Contém todos os arquivos PNG utilizado nos códigos
- dados_transformados: Possui o dado base da análise exploratória. Esse dado é uma junção de vários datasets Olist