/pos-engenharia-dados

Meu trabalho de conclusão de curso de pós graduação

Primary LanguageJupyter Notebook

Projeto de Análise de Acidentes de Trânsito no Recife

Bem-vindo ao projeto de Engenharia de Dados focado na análise de acidentes de trânsito na cidade do Recife. Este repositório abriga todos os elementos necessários para entender, reproduzir e contribuir para o desenvolvimento deste estudo.

Estrutura do Repositório:

Requisitos:

Este diretório contém os requisitos necessários para executar o código deste projeto. Certifique-se de instalá-los antes de iniciar.

Data Raw:

Aqui você encontrará os conjuntos de dados brutos utilizados neste estudo. As fontes incluem a CTTU, Secretaria de Infraestrutura e Serviços Urbanos, e dados adicionais da Wikipédia.

Source:

Neste diretório, você terá acesso ao código-fonte do projeto. Os scripts em Python utilizam bibliotecas como pandas para manipulação de dados, unidecode para tratamento de acentuações, e AWS services (S3, EventBridge, Lambda, Quicksight, EC2) para processamento e visualização.

Testes:

Contém scripts e conjuntos de dados para testar a integridade e eficácia do código.

Como Utilizar:

Instalação de Requisitos:

Verifique o arquivo de requisitos no diretório correspondente para garantir que todas as dependências estejam instaladas.

Exploração dos Dados Raw:

O diretório Data Raw contém os conjuntos de dados originais. Explore para compreender as fontes e estrutura dos dados.

Execução do Código:

Acesse o diretório Source para encontrar os scripts em Python, principalmente o etl_process_2 . Execute-os em um ambiente compatível para realizar análises e gerar visualizações.

Testes:

Utilize os scripts disponíveis no diretório de Testes para verificar a integridade e eficácia do código