https://nbviewer.org/github/mosikk/stepik_churn_prediction/blob/master/stepik_churn_prediction.ipynb
Цель: проанализировать активность студентов курса "Анализ данных в R" на степике. На основе данных за первые 2 дня предсказать, закончит ли человек курс или бросит его. Курс считается пройденным, если решено не менее 40 задач.
events_data - данные о действиях, которые совершают студенты со стэпами.
- step_id - id стэпа
- user_id - анонимизированный id юзера
- timestamp - время наступления события в формате unix date
- action - событие, возможные значения:
- discovered - пользователь перешел на стэп
- viewed - просмотр шага
- started_attempt - начало попытки решить шаг (ранее нужно было явно нажать на кнопку - начать решение, перед тем как приступить к решению практического шага)
- passed - удачное решение практического шага
submissions_data - данные о времени и статусах сабмитов к практическим заданиям
- step_id - id стэпа
- timestamp - время отправки решения в формате unix date
- submission_status - статус решения
- user_id - анонимизированный id юзера
Данные уже поделены на train и test. В test файлах предтавлены данные только о первых 2 днях прохождения курса.