Subject: Задание Data Scientist HEINEKEN
Уважаемый кандидат, Предлагаем Вам решить задачу, условия которой сформулированы ниже.
Просим Вас вернуться к нам с решением в течение 7 дней.
После получения материалов, мы запланируем онлайн интервью, на котором Вы сможете представить результаты Вашего исследования.
Желаем удачи!
Задание
В файле train_data.csv содержатся данные о продажах магазина в период с 01.12.10 по 31.10.11.
Для каждого клиента, который делал заказ в период с 01.12.10 по 31.10.11, необходимо спрогнозировать вероятность совершения заказа в период с 01.11.11 по 30.11.11.
В качестве решения ожидаем от Вас:
- csv-файл вида
CustomerID | prob |
---|---|
1111111 | 0.1111111 |
-
код (Python/R)
-
презентация по результатам работы, включающая:
-
пайплайн решения задачи,
-
обоснование выбора модели и метрики качества,
-
возможное применение бизнесом результатов этого исследования,
-
Ваши рекомендации относительно перспектив дальнейшего исследования этого массива данных.