/LivelibExport

Скрипт для экспорта прочитанного на Livelib в CSV-файл

Primary LanguagePythonMIT LicenseMIT

LivelibExport

Краткое описание

Сервис https://www.livelib.ru не предоставляет удобного способа для экспорта прочитанного (как встроенной так и через API), поэтому был сделан отдельный скрипт для этого. Его использование поможет вам отвязаться от этого сервиса и иметь возможность мигрировать куда-нибудь еще.

Экспорт книг из LiveLib в CSV

  • Войти на сайт
  • Открыть ссылку вида https://www.livelib.ru/reader/userName/read/print, где userName - ваше имя пользователя
  • Скачать текущее содержимое страницы в файл любым методом в файл read.html в папке со скриптом
  • Установить python3 (https://www.python.org/downloads/) и pip3 (https://pip.pypa.io/en/stable/installing/)
  • Установить зависимость: pip3 install lxml
  • Запустить скрипт: python3 export.py
  • Будет загружен список книг из read.html и начата загрузка информации по ним
  • Подождать завершения процесса
  • Может потребоваться много времени, т.к. запросы отправляются с интервалом в 90-120 сек чтобы не было проблемы с блокировкой на стороне сервиса (это значение может быть изменено в скрипте, на свой страх и риск)
  • Итоговый файл out.csv будет содержать название, ISBN и рейтинг, поставленный книге
  • Если для каких-то книг не было найдено ISBN, это будет отображено в логе и можно будет их добавить вручную
  • Отсутствующий ISBN означает следующее:
    • Он не указан на странице, тогда можно попробовать его найти в других источниках
    • Его нет в принципе, тогда этот метод экспорта не поможет
    • Есть необработанная ситуация в парсере, тогда можно завести issue здесь с указанием ссылки на страницу
  • Итоговый файл пригоден для импорта на https://goodreads.com, но потенциально может быть использован и в других случаях
  • Исходный код проекта открыт, issue по изменениям и багам можно присылать, pull request'ы будут рассматриваться