/projetostack

Primary LanguageJupyter Notebook

projetostack

Projeto Stack Labs do time koalas apresentado no dia 27/01/2022 Integrantes: Clarice Satiko Aoto, Isis Souza, Marcos Costa, Octavio Oliveira e Peterson Silva

No corpo da pasta principal há os principais arquivos utilizados no processo.

  1. 20220126_MAQUINA_PREDITIVA.ipynb: traz o código utilizado para Machine Learning
  2. 20220126tratamentoDadosNLP.ipynb: traz o código de tratamento NLP, alguns insights e um teste de modelos para ML
  3. Koalas01_ipynb: é uma versão antiga que não foi usada no fim, mas que possui muitos códigos que foram importantes no desenvolvimento final, além de ter gerado o arquivo que foi trabalhado na análise exploratória
  4. analise_exploratoria.ipynb: traz o código com insights na exploração dos dados (há mais alguns no Power BI, visto que a análise exploratória ocorreu em dois ambientes)
  5. olist_processado.parquet: é um arquivo utilizado nos códigos
  6. olist_processado.parquet2: outro arquivo utilizado nos códigos

As demais pastas são compostas por material de apoio aos principais:

  1. JPEG: Contém todos os arquivos JPEG utilizado nos códigos
  2. Olist_map: Contém todos os csv segmentados segundo foco do grupo e os Shapefiles criados no QGIS
  3. PNG: Contém todos os arquivos PNG utilizado nos códigos
  4. dados_transformados: Possui o dado base da análise exploratória. Esse dado é uma junção de vários datasets Olist