/HSE_Statistics_1

Primary LanguageJupyter Notebook

Прикладная статистика

  1. Повтор теории вероятностей. Кое-что про полезные виды распределений. Оценивание параметров и сравнение оценок. Несмещенность и состоятельность. Метод моментов. Метод максимального правдоподобия.

  2. Метод Монте-Карло. Тяжелые хвосты. Распределение Коши. Выборочное среднее, выборочная медиана и выборочная мода. Выборочная дисперсия. Среднеквадратическое/стандартное отклонение. Генерация случайных величин и решение задач в Python.

  3. Построение доверительных интервалов. Квантили распределений. Распределения, связанные с нормальным: хи-квадрат и Стьюдента. Доверительные интервалы в нормальной модели. Бутстрэп (параметрический и непараметрический). Эмпирическая функция распределения. Работа с распределениями в Python. Построение доверительных интервалов в Python. Доверительные интервалы для параметра «успеха» в модели Бернулли в Python.

  4. Введение в проверку гипотез. Статистический критерий. Статистика критерия. Достигаемый уровень значимости (p-value). Критерии согласия. Критерий Колмогорова. Критерий Пирсона (хи-квадрат). Проверка равномерности. Проверка экспоненциальности (исключение неизвестного параметра, критерий Гини). Проверка нормальности (критерий Шапиро-Уилка, критерий Харке—Бера). Визуальный метод проверки гипотезы масштаба/сдвига – квантильный график (Q-Q Plot).

  5. Введение в критерии однородности. Параметрические критерии: одновыборочный Z-критерий, одновыборочный t-критерий. Параметрические критерии однородности: одновыборочные и двухвыборочные Z-критерий и t-критерий (независимые и зависимые выборки). Непараметрические критерии однородности для независимых выборок: критерий Колмогорова-Смирнова, критерий хи-квадрат, критерий Манна-Уитни.

6,7) Непараметрические критерии однородности для зависимых выборок: критерий знаков, критерий знаковых рангов Уилкоксона. Оценка параметра сдвига. Критика критериев Стьюдента. Реализация всех критериев в Python. Парадокс критерия хи-квадрат. Ранняя остановка АБ-тестов (почему нельзя останавливать, как только вы увидели нужное p-value). Многорукие бандиты для выигрыша распределенного по Бернулли и экспоненциально (набор различных стратегий). Различные виды корреляций.

Предыдущая версия курса

ДЗ

При сдаче дз называйте файл своими именем-фамилией. Чтобы не выбирать формат, сдавайте задания в формате ipynb-ноутбуков. Текстовые задания оформлять в Markdown. Если очень лень писать формулы в LaTex, можете приложить ссылки на картинки рукописного текста, но так, чтобы итоговым результатом сдачи дз был ОДИН ipynb-файл. Так намного легче проверять.