/sdbase

Scripts Básicos para Sociologia Digital

Primary LanguagePython

Scripts Básicos para Sociologia Digital (sdbase)

Esse repositório guarda uma série de scripts básicos para o auxílio à pesquisa em Sociologia Digital. O objetivo dessa iniciativa é facilitar o acesso às técnicas computacionais a pesquisadores não familiarizados com essas técnicas, a iniciantes, assim como a usuários avançados que queiram construir técnicas mais complexas em cima das mais básicas aqui disponíveis. O foco do sdbase é o auxílio computacional à pesquisa qualitativa, mineração de texto para as humanidades e áreas relacionadas.

Raspador do Reddit para a Análise Qualitativa e Codificação: rdqda

O rdqda é um módulo e script pythônico para a formatação e exportação de dados da rede social Reddit próprio para a análise qualitativa e a codificação. O formato de saída dos dados privilegia, portanto, a fidelidade à forma como os dados são exibidos na rede social, aproximando a prática da codificação à experiência da plataforma no browser. Recomendamos ao usuário que clone o repositório para usá-lo, tal como explicado abaixo, na seção de instalação. Para usuários mais avançados, basta adicionar o módulo ao PYTHONPATH e importá-lo em seu código.

Estruturação de dados textuais de conversas do WhatsApp

Por enquanto, o módulo e script do WhatsApp oferece apenas a conversão para csv de dados de conversas em txt exportados diretamente pelo aplicativo. Veja abaixo instruções para o modo de uso.

Requisitos para a instalação

  • Python 3.8
  • pandas (biblioteca para manipulação de dados via DataFrames)
  • PRAW (biblioteca que facilita o acesso à API do Reddit)

O arquivo requirements.txt contém todas essas informações, o que permite uma instalação fácil, como indicado na seção abaixo.

Instalação e modo de uso

Basta clonar o repositório, criar um ambiente virtual, instalar as bibliotecas indicadas acima com o pip e rodar os scripts com o Python, como no exemplo abaixo:

cd diretorio-de-instalacao 
git clone https://github.com/vmussa/sdbase.git
cd sdbase
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Para o usar módulo do Reddit:

python reddit\submissions_para_txt.py

Para o usar módulo do WhatsApp:

python whatsapp\conversas_para_csv.py

Agradecimentos

Esse repositório está sendo desenvolvido no contexto de uma pesquisa de mestrado financiada pela Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) realizada no Programa de Pós-Graduação em Sociologia e Antropologia (PPGSA) da Universidade Federal do Rio de Janeiro (UFRJ). O desenvolvimento desse pacote deve muito ao apoio dessas instituições.