Este repositório contém utilitários e funções de web scraping para coletar dados relacionados aos deputados federais na Câmara dos Deputados do Brasil. Essas ferramentas podem ser usadas para extrair as mais diversas informações que não estão disponíveis na api da câmara, ou que não estão estruturada de uma forma organizada.
As informações não disponíveis na API da câmara são estraídas do site oficial do Câmara dos Deputados (https://www.camara.leg.br/)
Se você tiver de alguma outra informação que esteja disponível lá, abra uma issue.
- Coleta dos gastos mensais da verba de cabineta de um/a parlamentar.
- Coleta dos secretários ativos do gabinete de um/a parlamentar.
- Coleta dos secretários inativos do gabinete de um/a parlamentar.
- Coletar o salário de cada secretário.
- Coleta eventos e gravações de fala do parlamentar.
- Armazenar em núvem os arquivos para não depender da disponibilidade da cloud da câmara.
Certifique-se de ter as seguintes dependências instaladas:
- Python 3
-
Clone este repositório:
git clone https://github.com/seu-usuario/utils.git
-
Navegue até o diretório do repositório:
cd utils
-
Instale as dependências
-
Execute o script
python3 extract_gabinet_data.py
Gostaríamos muito da sua ajuda para melhorar este projeto. Se você deseja contribuir, siga estas etapas:
- Faça um fork deste repositório.
- Clone o fork em sua máquina local.
- Crie uma nova branch:
git checkout -b minha-contribuicao
- Faça suas alterações e commit:
git commit -m "Adicionei novos recursos"
- Envie suas alterações para o GitHub:
git push origin minha-contribuicao
- Abra um pull request para revisão.
Participe da nossa comunidade no discord para discussões, feedback e suporte: