/hh_eval

Primary LanguagePerl

Что это за репо?

Датасет с откликами на вакансию о стажировке и код прошлой его обработки

perl_scripts - perl скрипты для получения и обогащения данных с HH API (TODO: переписать с помощью нейросети на Python и замерить на каком языке код работает быстрее)

hhdata - часть старого кода на python для обработки данных (TODO: зарелизить на pip как отдельный модуль)

Как получился датасет?

  1. Сохраняем все отклики (perl_scripts/01_get_all_applications.pl)
  2. Обогащаем каждый отклик дополнительными данными - свойства messages и resume_detailed (perl_scripts/02_enrich_data.pl)
  3. Приводим датасет к линейному виду (perl_scripts/03_make_csv.pl)