/stepik_churn_prediction

Определение вероятности, что человек закончит курс

Primary LanguageJupyter Notebook

Stepik churn prediction

https://nbviewer.org/github/mosikk/stepik_churn_prediction/blob/master/stepik_churn_prediction.ipynb

Цель: проанализировать активность студентов курса "Анализ данных в R" на степике. На основе данных за первые 2 дня предсказать, закончит ли человек курс или бросит его. Курс считается пройденным, если решено не менее 40 задач.

Описание данных

events_data - данные о действиях, которые совершают студенты со стэпами.

  1. step_id - id стэпа
  2. user_id - анонимизированный id юзера
  3. timestamp - время наступления события в формате unix date
  4. action - событие, возможные значения:
    • discovered - пользователь перешел на стэп
    • viewed - просмотр шага
    • started_attempt - начало попытки решить шаг (ранее нужно было явно нажать на кнопку - начать решение, перед тем как приступить к решению практического шага)
    • passed - удачное решение практического шага

submissions_data - данные о времени и статусах сабмитов к практическим заданиям

  1. step_id - id стэпа
  2. timestamp - время отправки решения в формате unix date
  3. submission_status - статус решения
  4. user_id - анонимизированный id юзера

Данные уже поделены на train и test. В test файлах предтавлены данные только о первых 2 днях прохождения курса.