Usamos o pacote rtweet e uma lista de perfis de parlamentares feita colaborativamente pelo Serenata de Amor, Laboratório Analytics e mais gente legal para baixar os tweets de nossos representantes federais em 2019. O código para baixar e etc. não está nesse repositório.
Os dados brutos têm 72.316 tweets cuja data de criação segundo a API é em 2019. Esses tweets foram coletados em 22 de março de 2019 e estão em data/tweets-2019.csv.zip
. O script que os processa, cruza com a lista de parlamentares conhecidos e salva a atividade por parlamentar é code/0-cria-dataset.R
. O resultado é o arquivo data/atividade-por-perfil-20190322.csv
.
Observations: 608
Variables: 19
$ id_parlamentar <chr> "204554", "204521", "204379", "204560", "204528", "121948",…
$ casa <chr> "câmara", "câmara", "câmara", "câmara", "câmara", "câmara",…
$ nome_eleitoral <chr> "ABÍLIO SANTANA", "ABOU ANNI", "ACÁCIO FAVACHO", "ADOLFO VI…
$ partido <chr> "PR", "PSL", "PROS", "PSDB", "NOVO", "PP", "PSDB", "PT", "P…
$ UF <chr> "BA", "SP", "AP", "BA", "SP", "GO", "MG", "BA", "RS", "RS",…
$ twitter <chr> "AbilioSantana_", "abouannipv", "FavachoAcacio", "AdolfoVia…
$ seguidores <dbl> NA, NA, NA, NA, 4652, NA, NA, NA, NA, NA, NA, NA, NA, 3983,…
$ segue <dbl> NA, NA, NA, NA, 315, NA, NA, NA, NA, NA, NA, NA, NA, 995, 4…
$ n_proprio <dbl> 0, 0, 0, 0, 99, 0, 0, 0, 0, 0, 0, 0, NA, 49, 214, NA, 39, 3…
$ n_retweet <dbl> 0, 0, 0, 0, 9, 0, 0, 0, 0, 0, 0, 0, NA, 1, 30, NA, 4, 100, …
$ engaj_total <dbl> 0, 0, 0, 0, 7090, 0, 0, 0, 0, 0, 0, 0, NA, 4286, 6852, NA, …
$ engaj_total_proprio <dbl> 0, 0, 0, 0, 6701, 0, 0, 0, 0, 0, 0, 0, NA, 284, 2239, NA, 1…
$ engaj_total_retweet <dbl> 0, 0, 0, 0, 389, 0, 0, 0, 0, 0, 0, 0, NA, 4002, 4613, NA, 1…
$ engaj_mediano <dbl> 0.0, 0.0, 0.0, 0.0, 26.5, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0…
$ engaj_mediano_proprio <dbl> 0.0, 0.0, 0.0, 0.0, 22.5, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0…
$ engaj_mediano_retweet <dbl> 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0,…
$ engaj_max <dbl> 0, 0, 0, 0, 1031, 0, 0, 0, 0, 0, 0, 0, NA, 4002, 4227, NA, …
$ engaj_max_proprio <dbl> 0, 0, 0, 0, 1031, 0, 0, 0, 0, 0, 0, 0, NA, 38, 136, NA, 14,…
$ engaj_max_retweet <dbl> 0, 0, 0, 0, 99, 0, 0, 0, 0, 0, 0, 0, NA, 4002, 4227, NA, 81…
- id_parlamentar - ID do parlamentar segundo a API da câmara ou senado
- casa - se o parlamentar é da câmara ou senado
- nome_eleitoral - nome que vimos na urna
- partido - pela sigla do nome atual (MDB, DEM, ...)
- UF - por onde foi eleito
- twitter - Handle no twitter - NA se o parlamentar não tem perfil (ie, não encontramos)
- seguidores - Quantos perfis seguem o parlamentar.
NA
se o parlamentar não tem perfil ou se não tuitou em 2019 (e por isso não observamos seus seguidores). - segue - Quantos perfis ele/a segue.
NA
se o parlamentar não tem perfil ou se não tuitou em 2019 (e por isso não observamos seus seguidores). - n_proprio - Número de tweets que não são retweets ou retweets com comentário.
- n_retweet - Número de tweets que são retweets ou retweets com comentário.
- engaj_total - Engajamento = likes + retweets. Total = para todos os tweets vistos.
- engaj_total_proprio - Engajamento total em tweets de conteúdo próprio.
- engaj_total_retweet - Engajamento total em retweets.
- engaj_mediano - Mediana do engajamento em todos os tweets
- engaj_mediano_proprio - Mediana para tweets de conteúdo próprio
- engaj_mediano_retweet - Para retweets
- engaj_max - Máximo de engajamento em um tweet.
- engaj_max_proprio - Máximo para os de conteúdo próprio
- engaj_max_retweet - Máximo para os retweets