Проект по соревнованию с курса по ML на степике.
main_anlz.ipynb
- главный файл, формата .ipynb(в нем выполлняюстя все действия)
files
- в каталоге находятся датасеты.
-finish.csv - финальный сет(предсказание)
-event_data_train.zip - тренировочные данные
-events_data_test.csv - тренировочные данные
-submission_data_test.csv - тестовые данные
-submission_example.csv - пример предсказания
-submissions_data_train.zip - тестовые данные
Формулировка задания:
Мы будем считать, что пользователь успешно закончил курс, если он правильно решил больше 40 практических заданий.
Используя данные о первых двух днях активности на курсе вам нужно предсказать, наберет ли пользователь более 40 баллов на курсе или нет.
В этих данных, вам доступны только первые дня активности студентов для того, чтобы сделать предсказание. На самом деле, используя эти данные, вы уже можете сделать прогноз. Например, если пользователь за первые два дня набрал 40 баллов, скорее всего он наберет более 40 баллов в дальнейшем. Чтобы подкрепить такие гипотезы, вы можете использовать данные, на которые мы исследовали в первых двух модулях курса, где для всех пользователей представлены все данные об их активности на курсе.