/SegurancaPublicaSSP

Coleta de dados de Segurança Pública do Estado de São Paulo (Disponíveis em basedosdados.org e Secretaria de Segurança Pública dos Estado de São Paulo)

Primary LanguageJupyter NotebookCreative Commons Zero v1.0 UniversalCC0-1.0

Indicadores e estatísticas de violência para o Estado de São Paulo

Arquitetura de dados utilizada: Data Lake (event driven)
Tecnologias: AWS, SPARK, SQL, PYTHON, POWER BI

Objetivo do projeto:

  1. Coleta de dados da web.
  2. Armazenamento dos dados em ambiente cloud (AWS).
  3. Processamento dos dados utilizando PySpark (framework para processamento de big data).
  4. Tratamento dos dados e disponibilização em camadas (Raw, Trusted e Refined), podendo ser consumidas por outros usuários e áreas.
  5. Criação de um dashboard analítico para facilitar a visualização das informações.

Coleta de dados via (API)

Coleta de arquivos Excel (XLSX)

Diagrama da Arquitetura de Dados (Data Lake):

Event Driven Pipeline

Os scripts e notebooks utilizados estão disponíveis nas respectivas pastas.

Dashboard feito em Power BI:

Dashboard

Arquivo .pbix está disponível para download.

Obrigado!