Objetivo do projeto:
- Coleta de dados da web.
- Armazenamento dos dados em ambiente cloud (AWS).
- Processamento dos dados utilizando PySpark (framework para processamento de big data).
- Tratamento dos dados e disponibilização em camadas (Raw, Trusted e Refined), podendo ser consumidas por outros usuários e áreas.
- Criação de um dashboard analítico para facilitar a visualização das informações.
Coleta de dados via (API)
Coleta de arquivos Excel (XLSX)
Os scripts e notebooks utilizados estão disponíveis nas respectivas pastas.
Arquivo .pbix está disponível para download.
Obrigado!