/tse-analytics

Análise dos candidatos das eleições brasileiras de 2022

Primary LanguagePythonMIT LicenseMIT

Análise dos partidos e candidatos para Eleições de 2022

Dados coletados a partir do site do TSE: dadosabertos.tse.jus.br/dataset/candidatos-2022, armazenados e analisados durante as lives no canal Téo Me Why.

Segue os VODs para acompanhar o desenvolvimento:

Dia Descrição Link
2022-09-05 Análise de Bens e Clusters de Diversidade dos partidos 🔗
2022-09-07 Correções nas médias de taxas para a taxa geral. Mudança de representação gráfica. Novas bases adicionadas 🔗

Índice

1. ETL

Antes de nos debruçarmos diretamente em gráficos e análises, precisamos realizar o ETL (Extract Transform and Load), isto é, consultar os dados brutos e realizar os devidos filtros, cruzamentos e agregações. Desta maneira, como nosso intuito é realizar no primeiro momento uma análise voltada aos partidos, vamos agregar todas as informações dos candidatos por seus respectivos partidos.

Segue abaixo as estatísticas criadas a partir dos dados brutos:

Nome Variável Descrição
QTD_CANDIDATOS Quantidade de candidatos no partido
PCT_MASCULINO Percentual de candidatos do gênero masculino no partido
PCT_FEMININO Percentual de candidatas do gênero feminino no partido
PCT_LE_ESCREVE Percentual de candidatos que tem como "Sabe ler e escrever" como Grau de Instrução no partido
PCT_FUNDAMENTAL_INCOMPLETO Percentual de candidatos que tem como "Ensino Fundamental Incompleto" como Grau de Instrução no partido
PCT_FUNDAMENTAL_COMPLETO Percentual de candidatos que tem como "Ensino Fundamental Completo" como Grau de Instrução no partido
PCT_MEDIO_INCOMPLETO Percentual de candidatos que tem como "Ensino Médio Incompleto" como Grau de Instrução no partido
PCT_MEDIO_COMPLETO Percentual de candidatos que tem como "Ensino Médio Completo" como Grau de Instrução no partido
PCT_SUPERIOR_INCOMPLETO Percentual de candidatos que tem como "Ensino Superior Incompleto" como Grau de Instrução no partido
PCT_SUPERIOR_COMPLETO Percentual de candidatos que tem como "Ensino Superior Completo" como Grau de Instrução no partido
PCT_SOLTEIRO Percentual de solteiros no partido
PCT_CASADO Percentual de casados no partido
PCT_SEPARADO_JUDICIALMENTE Percentual de Separados Judicialmente no partido
PCT_DIVORCIADO Percendual de Divorciados no partido
PCT_VIUVO Percentual de Viúvos no partido
PCT_AMARELA Percentual de "cor e raça" amarela no partido
PCT_BRANCA Percentual de "cor e raça" branca no partido
PCT_INDiGENA Percentual de "cor e raça" indígena no partido
PCT_PARDA Percentual de "cor e raça" parda no partido
PCT_PRETA Percentual de "cor e raça" preta no partido
AVG_IDADE Média de idade no partido
VL_TOTAL_BEM_PARTIDO Valor total declarado em bens dos candidatos do partido
AVG_BEM_CANDIDATO Valor médio declarado por candidato do partido
MEDIAN_BEM_CANDIDATO Valor mediano declarado por candidato do partido
MAX_BEM_CANDIDATO Valor mais alto declarado do partido

Todos estes dados foram criados e persistidos na tabela silver_tse.sumario_partido e seu script pode ser encontrado em etl_sumario_partido.sql.

2. Análises

2.1. Bens declarados

De maneira trivial, podemos gerar um (ou dois) gráficos bem simples para entender o comportamento dos partidos em relação à declaração de bens. isto é, calcular a média (AVG_BEM_CANDIDATO) e mediana (MEDIAN_BEM_CANDIDATO) por partido. Para média:

grupos-partidos-media-bens

Agora para a mediana (menos sensível à dados afastados da média):

grupos-partidos-mediana-bens

Interessante como a ordem dos partidos no gráfico se altera quando utilizamos uma medida menos sensível à outliers.

2.2. Clusters em Diversidade

A partir da tabela criada anteriormente, dá-se início às análises. Com isso, a primeira ideia seria realizar agrupameneto entre os 33 partidos encontrados, buscando classificar partidos similares entre si em um mesmo grupo.

Utilizando as variáveis PCT_FEMININO e PCT_PRETA, aplicou-se o método de KMeans considerando 6 grupos. O resultado desta análise se dá pelo gráfico abaixo:

grupos-partidos-diversidade

Adicionamos também uma visão que considera o tamanho do partido, i.e., a quantidade de candidatos que este partido tem para essas eleições. O tamanho de cada bolha, diz a respeito da quantidade de candidatos presentes no partido:

grupos-partidos-diversidade-tamanho

Por fim, a mesma de forma análoga à quantidade de candidatos, realizamos para o valor mediano de bens em cada partido, onde este número reflete no tamanho de sua bolha.

grupos-partidos-diversidade-bens

O que se pode interpretar deste agrupamento? Vamos tentar responder abaixo.

Partidos Resumo
REPUBLICANOS, PSDB, UNIÃO, PL, PRTB, PV, PTB, PSD, NOVO, PP, PODE Grupo que possui menor diversidade, tanto em gênero quanto em raça e cor.
PROS, CIDADANIA, DC, PMB, PSB, PMN, SOLIDARIEDADE, MDB, PDT, PSC, REDE, AGIR, PATRIOTA, AVANTE Grupo que contém maior número de partidos. Possui proporções de mulheres na média, bem como tambem na média da proporção de raça preta.
PCO, PCB, PT Grupo concentrado um pouco acima da proporção de raça preta geral, mas na média da proporção de mulheres geral
PC do B Grupo com um único partido, possui uma proporção de mulheres mais elevada, bem como de raça preta, se destacando dos demais
PSOL, PSTU Um dos menores grupos, com apenas 2 partidos, estes que apresentam a maior proporção de raça preta..
UP Grupo com apenas um partido, pois este se destaca nitidamente por altas proporções de mulheres e raça preta, sendo o único que possui mais mulheres que homens em seu partido.