/hh_ru_parser

An advanced parser of vacancies from HeadHunter (hh.ru).

Primary LanguagePython

HH RU Parser

Данная библиотека написана в учебных целях анализа рынка труда. Это решение отлично от большинства других на github возможностью возвращать информацию в том объеме и в той форме, как это предоставляет официальный api. Библиотека содержит два основных модуля:

  • Parser: обычный парсер html страниц, отличается лишь возможностью извлекать чуть больше информации, чем это представляют остальные решения.
  • Api: имитирует поведение настоящего api. Обычные html парсеры не способны "вытащить" все вакансии с очередной страницы поиска, в среднем теряется около 60% вакансий. Данный модуль возвращает информацию о всех возможных вакансиях, полученных с каждой страницы поиска без потерь, причем в том виде, в котором это предполагает официальный api.

Documentation

Скоро будет..