https://github.com/idlesign/imhodump
imhodump - это скрипт для экспорта в файл оценок, проставленных вами (или не вами) на imhonet.ru (фильмы, книги, игры).
Он посещает все страницы с оценками, собирает и складирует в файл следующие данные для каждого из оцененных объектов:
- URL с детальной информацией об объекте на imhonet.ru
- Название на русском
- Название на языке оригинала
- Год выпуска
- Оценка (десятибальная шкала)
До смены дизайна скрипт собирал ещё даты просмотра фильма и проставления оценки, но теперь эту информацию взять неоткуда.
Посещение страниц происходят в один поток, размеренно, то есть очень нежно по отношению к imhonet %)
Если посреди сбора оценок что-то пойдёт не так (imhonet, скажем, помашет ручкой на некоторое время), можно со спокойной душой завершить работу скрипта, а потом продолжить - данные в файле с оценками не продублируются.
Собранные данные сохраняются в указанный файл в формате json http://ru.wikipedia.org/wiki/JSON, далее вы можете обратиться к данным из этого файла в любом из ваших скриптов на python/ruby/javascript и использовать их во имя добра (или, скажем, перенести оценки на КиноПоис или IMDb).
В дополнение к json-файлу формируется .html файл со всеми оценками в категории, при помощи которого можно в ручном режиме перенести оценки на КиноПоиск и Goodreads (откройте его в браузере, и за работу).
Для запуска скрипта потребуются:
- Python 3.3+
- Модуль requests
- Модуль lxml
В консоли запускаем скрипт и медитируем на бегущие строчки (или идём спать):
> python imhodump.py ваш_логин_на_imhonet нужная_категория
То есть, например:
> python imhodump.py idle films
Или, что более вероятно:
> python3 imhodump.py idle films
Оценки будут сохранены в файлы imho_rates_{категория}_{ваш_логин}.json и imho_rates_{категория}_{ваш_логин}.html рядом с нашим скриптом.
Если скрипт не собирает оценки, то, скорее всего, бравые создатели imhonet в очередной раз поменяли расположение элементов на страницах с оценками (например, сменили дизайн). В этом случае вам следует либо плюнуть на сбор оценок, либо познакомиться с Питоном, на котором написан скрипт, ближе.