Публичное решение для задач Matching & Puzzle VTB DataFusion Contest 2022
- Иван Александров https://github.com/Ivanich-spb
- Петр Михайлов https://github.com/PeMikj
- 2-ое место в номинации Companion (лучшее публичное решение)
- 3-е место в номинации Insight
- 4-ое место в задаче Education
- 9-ое место в задаче Puzzle
- 12-ое место в задаче Matching
Необходимо решить Matching задачу, используя данные транзакций клиентов банка и кликстрима интернет-пользователей компании "Ростелеком". Решение сдается в формате контейнеров с кодом. Данные для задачи
Решение протестиовано: на Public Leaderboard позволяет зайти в top-20 по обеим задачам(на 01.05.2022).
- R1: более 0.26 (Matching)
- R1: более 0.040 (Puzzle)
Фичи представлены самые простые, чтобы продемонстрировать подходы к решению и направления для экспериментов.
- Протестировано на бесплатных ресурсах платформ Kaggle & GoogleColab
- Для запуска локально: 16Gb Ram, GPU(optional)
- Функции для обнаружения и удаления выбросов
- Функция генерации "SMART" негативов
- Отсечение признаков по "feature importance"
- Обучение CatBoost Ranker с ранжирующим лоссом
- Локальная валидация