Соревнование DS на вступительных испытаниях Ozon Masters в 2021

https://www.kaggle.com/c/ozon-masters-ds-contest-2021/overview

Overview

Постановка задачи

Требуется по описанию компьютерной игры предсказать победителя. Игра ведётся в режиме 1 на 1 двумя игроками, они названы игрок 1 и игрок 2, но этот порядок не даёт никакому из игроков преимущества (это не пошаговая игра, а игра в режиме реального времени, поэтому нет и преимущества первого хода). Игроки управляют юнитами (которые игроки выбирают, прокачивают перед сражением). В армии каждого игрока 8 разных юнитов, состав армии фиксирован на время сражения, но его можно менять перед сражением. Исход игры зависит от случая, мастерства игроков и способности юнитов взаимодействовать и уничтожать юниты противника.

Нет "самого сильного юнита", они организованы по принципу "камень-ножницы-бумага". Например, дракон легко убивает рыцаря, лучник - дракона, а рыцарь - лучника. Аналогично, нет самой сильной армии. Однако, армия может быть составлена удачно и неудачно (удачной считается сбалансированная: когда для любого юнита соперника найдётся более сильный юнит).

Заметки

Обращаем внимание, что в публичном лидерборде всего 1% тестовой выборки (он нужен лишь для контроля корректности посылки). Правильно организуйте локальный контроль! Данных для локального контроля достаточно.

Evaluation

Для оценки используется logloss.

Data

Описание данных

  • train.csv - обучающая выборка с целевым признаком
  • test.csv - тестовая без целевого
  • sample_submission.csv - пример решения

Названия признаков

  • X0 - режим (тренировка, бой, бой на чемпионате и т.п.)
  • X1 - игрок 1 (id)
  • X2 - рейтинг игрока 1 до игры (порядковый)
  • X3 - игрок 2 (id)
  • X4 - рейтинг игрока 2 до игры (порядковый)
  • X5 - юнит 1 игрока 1 (ниже описание армий игроков, перечислены id юнитов, описание юнитов не даётся)
  • X6 - юнит 2 игрока 1

...

  • X12 - юнит 8 игрока 1
  • X13 - юнит 1 игрока 2

...

  • X20 - юнит 8 игрока 2
  • X21 - время игры (порядковый)

Все признаки, которые не помечены как порядковые – категориальные. Целевое значений = 1, если выиграл первый игрок, иначе = 0.

Rules

  • Задача решается индивидуально.
  • Использование ликов в данных допустимо.
  • Запрещается делиться своими находками (ликов или особенностей данных), а также кодом с другими участниками.
  • Ограничений по ресурсам нет.
  • Если вы используете ноутбуки Kaggle, оставляйте их приватными.
  • Форумом Kaggle тоже нельзя пользоваться для обсуждения. Если у вас есть вопросы, их нужно направить организаторам. Ответы на популярные вопросы или другие новости этого соревнования будут освещаться в канале Telegram.
  • В день дается две попытки. Вы видите расчет метрики на публичной части датасета, а итоги будут подводиться по приватной части датасета, которая откроется через некоторое время после дедлайна.
  • Название команды. Несмотря на то, что вы работаете над решеним в одиночку, нужно задать название команды из одного человека в пункте меню Team на главной странице соревнования. Впишите туда ваше ФИО, например: Сергеева Лидия Николаевна.
  • После дедлайна и перед подведением итогов, мы попросим вас прислать ваши решения для проверки на воспроизводимость (см. ниже) и плагиат.

Заметки

Обращаем внимание, что в публичном лидерборде всего 1% тестовой выборки (он нужен лишь для контроля корректности посылки). Правильно организуйте локальный контроль! Данных для локального контроля достаточно. Решения

Вы должны загрузить ваше решение через бот @ozonm_comp_bot. Решение может быть в виде запускаемой программы или jupyter-ноутбука. В решении обязательно должно быть описание вашего решения - в комментариях в тексте программы в самом начале, или в markdown-ячейке ноутбука. Перед загрузкой удалите чрезмерный текст из ячеек вывода.

Общие советы

Займитесь решением пораньше. Kaggle не идеальная платформа, и бывают сбои. Например, вы загружаете решение, но оно не принимается, а ваша попытка сгорает из-за какого-то сбоя. Мы не сможем вам помочь в такой ситуации, только посочувствовать. У нас не будет возможности восстановить вам попытку, или залить за вас ваш файл submission.csv. Поэтому не откладывайте на последние дни.