l2r_test

У тебя есть датасет для ранжирования intern_task.csv (тут).

В нем есть query_id - айдищник поисквой сессии, фичи релевантности документа запросу, rank - оценка релевантности.

Твоя задача:

подготовить и проверить датасет.
натренировать на любом удобном фреймворке модель, которая будет ранжировать документы по их фичам внутри одной сессии (query_id) (по вектору фичей предсказывать ранк документа).
посчитать метрики ранжирования для своей модели (ndcg_5 как минимум).
оформить решение и выложить на github, gitlab.

В поле ответа вставь ссылку на твой проект на гите.

pevepeve/l2r_test