Семинары по машинному обучению для бакалавров 3 курса кафедры ММП и магистров 1 курса кафедр ИИТ и МФ факультета ВМК МГУ, осенний семестр 2022/2023

В репозитории находятся материалы и домашние задания по семинарам "ММРО 2022/2023"

Курс сдается через систему anytask. Инвайт можете получить у преподавателя

Полезные ссылки:

Правила выставления оценок

По этому курсу (ММРО) в конце семестра будет экзамен

Общая оценка по нему выставляется по следующей формуле: , где

  • Check — 5 * <сумма баллов за проверочные> / <суммарный макс балл за проверочные>
  • Labs — min(5, 5 * <сумма баллов за лабораторные + конкурсы + теор. дз.> / <суммарный макс балл за (лабораторные + конкурсы + теор.дз) (без бонусов)>
  • Exam — оценка за экзамен, до 5 баллов

Причем

  • Для общей оценки 5 необходимо сдать все (5) лабораторные работы (4) и теор. дз. (1) на оценку (без учета штрафа) >= floor(1/3 * (макс. балл за работу без учета бонусов)) и получить за эказамен не меньше 4;
  • Для общей оценки 4 необходимо сдать не менее 3-х работ из всего множества лабораторных работ и теор. дз. на оценку (без учета штрафа) >= floor(1/3 * (макс. балл за работу без учета бонусов)) и получить за экзамен не меньше 3;
  • Для общей оценки 3 необходимо сдать не менее 2-x работ из всего множества лабораторных работ и теор. дз. на оценку (без учета штрафа) >= floor(1/3 * (макс. балл за работу без учета бонусов)) и получить за экзамен не меньше 3;
  • floor — округление дробного числа до ближайшего целого вниз.

Обратите внимание, что округление общей оценки (и только ее) производится вверх.

По курсу лекций в конце семестра будет зачет без оценки

Для получения этого зачета вам необходимо сдать не менее 2-x работ из всего множества лабораторных работ и теор. дз. на оценку (без учета штрафа) >= floor(1/3 * (макс. балл за работу без учета бонусов))

Занятия

Дата Номер Тема Материалы ДЗ
8 сентября Семинар 1 Работа с табличными данными. Pandas. Разведочный анализ данных Ноутбук с семинара Легкая домашка на пандас
15 сентября Семинар 2 Быстрый поиск ближайших соседей https://github.com/esokolov/ml-course-hse/blob/master/2020-spring/lecture-notes/lecture20-knn.pdf ¯\_(ツ)_/¯
22 сентября Семинар 3 Особенности knn и разновидности метрик https://github.com/esokolov/ml-course-hse/blob/master/2020-spring/seminars/sem19-knn.pdf ¯\_(ツ)_/¯
29 сентября Семинар 4 sklearn и особенности линейной регрессии https://github.com/esokolov/ml-course-hse/blob/master/2020-fall/seminars/sem02-sklearn-linregr.ipynb ¯\_(ツ)_/¯
6 октября Семинар 5 Векторное дифференцирование Хороший cheat sheet по дифференцированию Домашка на линейную регрессию
13 октября Семинар 6 Логистическая регрессия: оценивание вероятностей и вывод функционала, калибровка вероятностей Семинар (раздел 1) ¯\_(ツ)_/¯
20 октября Семинар 7 Теорема Куна-Таккера и двойственные задачи https://github.com/esokolov/ml-course-hse/blob/master/2020-spring/seminars/sem13-kkt.pdf Хардкорная домашка на дифференцирование
27 октября Семинар 8 Ядровые обобщения методов, задачи на ядра https://github.com/esokolov/ml-course-hse/blob/master/2020-spring/seminars/sem14-kernels.pdf ¯\_(ツ)_/¯
3 ноября Семинар 9 Метрики качества классификации, задачи на площади под кривыми https://github.com/esokolov/ml-course-hse/blob/master/2020-fall/seminars/sem05-linclass-metrics.pdf Домашка на линейную классификацию
10 ноября Семинар 10 Разложение ошибки на смещение и разброс https://github.com/esokolov/ml-course-hse/blob/master/2020-fall/lecture-notes/lecture08-ensembles.pdf ¯\_(ツ)_/¯
17 ноября Семинар 11 Вывод критериев информативности для деревьев, разглядывание картинок про деревья ссылка 1 ссылка 2 ¯\_(ツ)_/¯
24 ноября Семинар 12 Градиентный бустинг https://github.com/esokolov/ml-course-hse/blob/master/2021-fall/lecture-notes/lecture10-ensembles.pdf ¯\_(ツ)_/¯
1 декабря Семинар 13 Почему градиентный бустинг так устроен https://github.com/esokolov/ml-course-hse/blob/master/2020-fall/seminars/sem09-gbm-part1.pdf последний бой
8 декабря Семинар 14 coming soon ¯\_(ツ)_/¯
15 декабря Семинар 15 coming soon ¯\_(ツ)_/¯