/data-visualization-crawler

MyAnimeList data collector, to be used in Metabase to generate graphs.

Primary LanguagePythonMIT LicenseMIT

Visualização de dados MyAnimeList

Metabase

Organização dos dados

Os dados são salvos em formato json que é o formato que é mandado para o mongodb. Veja os exemplos dos dados na pasta docs Todos os dados que estão sendo pegos pelo bot vem do MyAnimeList.

Como rodar

  • Primeiro instale as dependências:

    pip3 install -r requirements.txt
  • Baixe o chromedriver compatível com a versão do seu navegador Chrome.

  • Crie dois arquivos um chamado db_user.txt e outro chamado db_password.txt, e crie um nome de usuario e uma senha, isso será usado para o mongo, postgres e o metabase.

  • Suba o mongo, metabase e o postgres com o: docker-compose -f docker-compose.yml up.

  • Configure o .env com o caminho completo do chromedriver e informações dos bancos de dados Mongo e Postgres.

  • Rode o crawler com o usuário desejado

    python3 ./src/crawler.py -n MarcosInja 
  • Rode o Higienizador de dados para salva-los no Postgres

    python3 ./src/saned_data.py