/mipt_data_science_2021

Курс по анализу данных онлайн-магистратуры МФТИ осень 2021

Primary LanguageJupyter Notebook

mipt_data_science_2021

Курс по анализу данных онлайн-магистратуры МФТИ осень 2021

Лекция 1

Ссылка на Jupyter Notebook

Описание: Описательные статистики. Квантили, квартили. Гистограммы. Ядерная оценка плотности. Ящики с усами. Выбросы.

Лекция 2 и 3

Ссылка на Jupyter Notebook

Что такое случайность. Случайная величина и ее распределение. Характеристики случайных величин. Какими бывают случайные величины (примеры распределений).

Генерация случайных велечин в Python. Расчет описательных статистик. Гистограмма и эмпирическая функция распределения: расчет. Эмпирическое распределение в Python. Описательные статистики в pandas. pandas: группировка и простые методы визуализации.

Лекция 4

Ссылка на Jupyter Notebook

Зависимы и независимые случайные величины: Корреляция Спирмена, Корреляция Пирсона, Ковариация. Независимость и ковариация. Корреляция в python. Нормальное распределение и его свойства. Многомерное нормальное распределение.

Лекция 5

Ссылка на Jupyter Notebook

Типы данных, меры и типы переменных. Выборка, ошибки выборки, объем выборки. Пропуски и выбросы. Преобразование Бокса - Кокса. Масштабирование и категориальные переменные.

Лекция 6 и 7

Ссылка на Jupyter Notebook

Иерархический кластерный анализ. Кластер, расстояния между объектами, расстояния между кластерами. Алгоритм построения дендрограммы. Каменистая осыпь/локоть. Стандартизация данных. Типичные ошибки при подготовке данных. Интрепретация результатов.

Метод к-средних. Датчики случайных чисел, зерно датчика. Визуализация алгоритма метода к-средних. Методы определения числа кластеров. Библиотека Sklearn. Каменистая осыпь/локоть. Многомерное шкалирование для визуализации кластеров.

Домашнее задание # 1

Ссылка на Jupyter Notebook

Лекция 8

Парсинг данных с помощью Selenium

Ссылка на Jupyter Notebook

Лекция 9

Лекция 10

Лекция 11

Лекция 12

Домашнее задание # 2

Ссылка на Jupyter Notebook

Лекция 13

Лекция 14

Лекция 15

Домашнее задание # 3

Ссылка на Jupyter Notebook