Bem-vindo ao projeto de Engenharia de Dados focado na análise de acidentes de trânsito na cidade do Recife. Este repositório abriga todos os elementos necessários para entender, reproduzir e contribuir para o desenvolvimento deste estudo.
Este diretório contém os requisitos necessários para executar o código deste projeto. Certifique-se de instalá-los antes de iniciar.
Aqui você encontrará os conjuntos de dados brutos utilizados neste estudo. As fontes incluem a CTTU, Secretaria de Infraestrutura e Serviços Urbanos, e dados adicionais da Wikipédia.
Neste diretório, você terá acesso ao código-fonte do projeto. Os scripts em Python utilizam bibliotecas como pandas para manipulação de dados, unidecode para tratamento de acentuações, e AWS services (S3, EventBridge, Lambda, Quicksight, EC2) para processamento e visualização.
Contém scripts e conjuntos de dados para testar a integridade e eficácia do código.
Verifique o arquivo de requisitos no diretório correspondente para garantir que todas as dependências estejam instaladas.
O diretório Data Raw contém os conjuntos de dados originais. Explore para compreender as fontes e estrutura dos dados.
Acesse o diretório Source para encontrar os scripts em Python, principalmente o etl_process_2 . Execute-os em um ambiente compatível para realizar análises e gerar visualizações.
Utilize os scripts disponíveis no diretório de Testes para verificar a integridade e eficácia do código