Corpora de tweets sobre campanhas do calendário da saúde brasileiro
O corpora é composto por datasets de cada campanha do calendário. Esses datasets possuem tweets do período de 10 anos (2010 a 2020), utilizando as hashtags mais frequentes das campanhas (ex.: #janeirobranco, #cuidadomental, #valorizese, ...). Os tweets foram extraidos através de uma modificação do package snscrape, que permite a extração e geração de dataframes em formato CSV (clique aqui para saber mais da branch).
Caso utilize esse corpora, por favor, inclua uma citação desse repositório junto ao trabalho.