Esse código foi desenvolvido com o objetivo de coletar informações de uma página de um estabelecimento do TripAdvisor e salvar em um arquivo xls (excel). A URL para a raspagem precisa necessariamente ser do TripAdvisor e ser uma página de um estabelecimento. O script irá coletar as seguintes informações:
- Nome do estabelecimento
- Nota do estabelecimento
- Quantidade de avaliações do estabelecimento
- Serviços do estabelecimento
Caso o usuário queira, também é possível coletar as avaliações dos clientes. Ao executar o script será perguntado quantas avaliações o usuário quer coletar. Das avaliações será coletado:
- Nome do cliente
- Título da avaliação
- A avaliação
- Data da estadia
Python, Selenium
Importante: é necessário ter o Google Chrome instalado para executar esse script
- Baixe o script aqui
- Descompacte o arquivo
.zip
- Execute o arquivo
tripadvisor_scraping.exe
- Informe a URL para fazer a raspagem
- Informe o nome do arquivo para salvar
- Informe a quantidade de comentários (informando 0 não irá coletar nenhum)
- Após o script terminar de executar, o arquivo estará disponível na pasta
data
com o nome escolhido inicialmente