/andan_2023

Do you have some data?

Primary LanguageJupyter NotebookMIT LicenseMIT

Анализ данных на python (коллекция весна 2023)

Полезные ссылки

Идеология курса

Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.

На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)

Домашние задания и контрольные

Домашки:

Мини-самостоялки:

Большой план маленьких побед

  • sem01 Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
  • sem02 Вводимся в numpy
  • sem03 Вводимся в pandas и визуализацию
  • sem04 Метод моментов, ЦПТ, доверительные интервалы.
  • sem05 Больше EDA и разной визуализации!
  • sem06 Базовое машинное обучение. Вводим основные понятия ML. Говорим про KNN.
  • sem07 Разбираемся с линейной регрессией и как её обучить.
  • sem08 Обсуждаем решуляризацию и подбор гиперпараметров
  • sem09 Что такое классификация и логистическая регрессия?
  • sem10 Метрики классификации. Roc-auc.
  • sem11 АБ-тестирование, гипотезы, критерии.
  • sem12 Больше гипотез и критериев! Непараметрические тесты.
  • sem13 Семинар про бустрап.
  • sem14 Метод максимального правдоподобия.
  • sem15 Резервный семинар на всякий случай.

Самый важный раздел

Вы поулчаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:

Итог = Округление(0.1 * МСР + 0.4 * ДЗ + 0.3 * П + 0.2 * КР)
  • МСР — мини-тесты на парах
  • ДЗ — домашние работы (их будет 4 штуки, по каждой логической части курса)
  • П — свой проект длинной в семестр (расскажем детали позже)
  • КР — контрольная в виде демо-варианта независимого экзамена

Обратите внимание, что отдельная оценка будет ставиться за независимый экзамен. Чтобы его сдать придётся заботать не только питон, но ещё и матстат с тревером.

Лицензия

Весь контент, созданный для этого курса распространяются на правах лицензии MIT License либо на правах лицензии WTFPL на ваш выбор. Материалы публикуются как общественное достояние.