/tripadvisor-scraping

Raspagem de dados (Web Scraping) da página de um estabelecimento do TripAdvisor

Primary LanguagePython

Raspagem de dados (web scraping) - TripAdvisor

Projeto

Esse código foi desenvolvido com o objetivo de coletar informações de uma página de um estabelecimento do TripAdvisor e salvar em um arquivo xls (excel). A URL para a raspagem precisa necessariamente ser do TripAdvisor e ser uma página de um estabelecimento. O script irá coletar as seguintes informações:

  • Nome do estabelecimento
  • Nota do estabelecimento
  • Quantidade de avaliações do estabelecimento
  • Serviços do estabelecimento

Caso o usuário queira, também é possível coletar as avaliações dos clientes. Ao executar o script será perguntado quantas avaliações o usuário quer coletar. Das avaliações será coletado:

  • Nome do cliente
  • Título da avaliação
  • A avaliação
  • Data da estadia

Desenvolvido com:

Python, Selenium

Como utilizar:

Importante: é necessário ter o Google Chrome instalado para executar esse script

  • Baixe o script aqui
  • Descompacte o arquivo .zip
  • Execute o arquivo tripadvisor_scraping.exe
  • Informe a URL para fazer a raspagem
  • Informe o nome do arquivo para salvar
  • Informe a quantidade de comentários (informando 0 não irá coletar nenhum)
  • Após o script terminar de executar, o arquivo estará disponível na pasta data com o nome escolhido inicialmente