/tripadvparser

Парсер сайта tripadvisor

Primary LanguagePython

tripadvparser

Последнее обновление 20.07.17.

tripadvparser - парсер отелей сайта tripadvisor. Собирает следующую информацию на разных языках:

  • Название отеля
  • Адрес
  • Номер телефона
  • Email
  • Описание
  • Количество номеров
  • Количество звезд
  • Фото с галереи
  • Сервисы и удобства отеля
  • Цены

Требования

  • Python 3
  • PyYAML

Использование

python tripadvisor.py команда, где команда:

  • fetch_hotels - добавление отелей в БД
  • fetch_photos - закачка фото по отелям, которые уже есть в БД
  • fetch_prices - обновление цен по отелям, которые уже есть в БД
  • clean - удаление БД и фоток

conf.yaml - конфигурационный файл.

Результат работы по умолчанию находится в директории output.

output/tripadvisor.db - БД.

output/errors.log - лог с ошибками.

http://sqlitebrowser.org/ - клиент для просмотра БД.