Датасет с откликами на вакансию о стажировке и код прошлой его обработки
perl_scripts
- perl скрипты для получения и обогащения данных с HH API (TODO: переписать с помощью нейросети на Python и замерить на каком языке код работает быстрее)
hhdata
- часть старого кода на python для обработки данных (TODO: зарелизить на pip как отдельный модуль)
- Сохраняем все отклики (
perl_scripts/01_get_all_applications.pl
) - Обогащаем каждый отклик дополнительными данными - свойства
messages
иresume_detailed
(perl_scripts/02_enrich_data.pl
) - Приводим датасет к линейному виду (
perl_scripts/03_make_csv.pl
)