/Corpora-Calendario-da-Saude

Corpora de tweets sobre campanhas do calendário da saúde brasileiro

Corpora-Calendario-da-Saude

Corpora de tweets sobre campanhas do calendário da saúde brasileiro


Descrição

O corpora é composto por datasets de cada campanha do calendário. Esses datasets possuem tweets do período de 10 anos (2010 a 2020), utilizando as hashtags mais frequentes das campanhas (ex.: #janeirobranco, #cuidadomental, #valorizese, ...). Os tweets foram extraidos através de uma modificação do package snscrape, que permite a extração e geração de dataframes em formato CSV (clique aqui para saber mais da branch).


Caso utilize esse corpora, por favor, inclua uma citação desse repositório junto ao trabalho.