Igorps023/SegurancaPublicaSSP

Coleta de dados de Segurança Pública do Estado de São Paulo (Disponíveis em basedosdados.org e Secretaria de Segurança Pública dos Estado de São Paulo)

Jupyter NotebookCC0-1.0

Indicadores e estatísticas de violência para o Estado de São Paulo

Arquitetura de dados utilizada: Data Lake (event driven)

Tecnologias: AWS, SPARK, SQL, PYTHON, POWER BI

Objetivo do projeto:

Coleta de dados da web.
Armazenamento dos dados em ambiente cloud (AWS).
Processamento dos dados utilizando PySpark (framework para processamento de big data).
Tratamento dos dados e disponibilização em camadas (Raw, Trusted e Refined), podendo ser consumidas por outros usuários e áreas.
Criação de um dashboard analítico para facilitar a visualização das informações.

Coleta de dados via (API)

https://basedosdados.org/dataset/dbd717cb-7da8-4efd-9162-951a71694541?table=a2e9f998-e2c2-49b7-858a-ae1daef46dc0

Coleta de arquivos Excel (XLSX)

https://www.ssp.sp.gov.br/estatistica/dados-mensais

Diagrama da Arquitetura de Dados (Data Lake):

Os scripts e notebooks utilizados estão disponíveis nas respectivas pastas.

Dashboard feito em Power BI:

Arquivo .pbix está disponível para download.

Obrigado!