If you are English spoken, check out my English version of this repo.
Nesta apresentação, eu estarei utilizando dados abertos disponibilizados pela CENIPA - Centro de Investigação e Prevenção de Acidentes aeronáuticos. Tais arquivos conterão informações sobre ocorrências envolvendo aeronaves nos últimos 10 anos. Você pode acessar dados mais atualizados visitando a página oficial de Dados Abertos Brasileiros, mas, caso deseje, poderá estar realizando o download dos datasets utilizados aqui através dos links de download abaixo.
Para este estudo, utilizarei de dois datasets da CENIPA:
Ocorrencia.csv: possui os dados sobre cada ocorrência registrada nos últimos 10 anos. Código da ocorrência, Data, Motivo da Ocorrência e Localização serão encontrados nesse conjunto de dados.
Aeronave.csv: informações agrupadas sobre as aeronaves envolvidas nas ocorrências registradas no arquivo ocorrencia.csv. Aqui serão encontrados dados como: Modelo da Aeronave, Tipo de Aeronave, Fabricante, Quantidade de Fatalidades, dentre outras.
- Quais são as maiores causas de ocorrências e, eventualmente, queda de aviões?
- Como tem sido a progressão desses casos nos últimos anos? Tiveram menos ocorrências ou mais?
- Quais os estados que mais possuem ocorrências registradas?
- Qual tipo de aeronave possui mais problemas? Aviões, jatos, planadores?
- Quais as fabricantes com maior número de defeitos registrados?
- Será que durante o pouso é mais comum ter problemas do que durante a decolagem? Ou durante a viagem em si é mais frequente surgir defeitos?
- Viagens comerciais regulares tendem a ter mais problemas do que voos fretados?
- Quantos incidentes com fatalidades (morte de passageiros e tripulação) temos registro nos últimos 10 anos?
- Python 3.5
- Pandas
- Matplotlib
- Random