/ML_DM_HSE_minor

Primary LanguageJupyter Notebook

Майнор "Интеллектуальный анализ данных"
2016 ФКН НИУ ВШЭ

Интеллектуальный анализ данных (Data Mining) - это процесс обнаружения в "сырых" данных конкретных знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Распространение информационных технологий привело к детальному протоколированию всех процессов бизнеса, производства и жизни человека. Это позволило оперативно собирать и накапливать огромные массивы данных, анализ которых является нетривиальной проблемой, но приносит колоссальную пользу. Можно привести множество примеров уже существующих интеллектуальных систем - от поисковых систем в Интернете до распознавания речи и управления компьютером жестами. Несмотря на достигнутые успехи, большинство проблем анализа данных являются открытыми, и можно ожидать бурного прогресса в этой области на протяжении ближайших 20-30 лет и, как следствие, востребованность специалистов, знакомых с основами интеллектуального анализа данных.

Курсы майнора:

1 курс. "Введение в программирование"

  • Семинар 1. Введение в программирование. Знакомство c интерпретатором и со средой разработки PyCharm.
  • Семинар 2. Простые типы данных. Числа и операции над ними. Условный оператор.
  • Семинар 3. Циклы.
  • Семинар 4. Строки. Алгоритмы на строках.
  • Семинар 5. Списки и кортежи.
  • Семинар 6. Словари. Множества.
  • Семинар 7. Функции. Рекурсия.
  • Семинар 8. Работа с файлами.
  • Семинар 9. Контрольная работа.
  • Семинар 10. Алгоритмы. Сортировка и поиск. Задачи на линейный и бинарный поиск.
  • Семинар 11. Структуры данных. Задачи на использование различных структур данных хранения.
  • Семинар 12. Элементарные задачи на графы. Способы задания графов. Обход в глубину. Обход в ширину.
  • Семинар 13. Работа с библиотеками NumPy, Matplotlib, Seaborn.
  • Семинар 14. Работа с библиотекой Pandas.
  • Семинар 15. Работа со стандартной библиотекой.

2 курс. "Введение в анализ данных"

  • Семинар 1. Введение в машинное обучение.
  • Семинар 2. Python для анализа данных. Средства визуализации. Pandas, Matplotlib, Seaborn.
  • Семинар 3. Линейная алгебра и Python. NumPy, SciPy.
  • Семинар 4. Математический анализ и Python. SymPy.
  • Семинар 5. Теория вероятностей и Python.
  • Семинар 6. Математическая статистика и Python.
  • Семинары 7 и 8. Линейные модели в машинном обучении.
  • Семинары 9 и 10. Оценка качества алгоритмов машинного обучения.
  • Семинары 11 и 12. Композиции алгоритмов. Случайный лес и бустинг.
  • Семинары 13 и 14. Продвинутые методы классификации и регрессии. Xgboost. Блендинг.
  • Семинары 15 и 16. Обучение без учителя.

3 курс. Модуль 1. "Современные методы машинного обучения"

  • Семинар 1. Ядра и метод опорных векторов.
  • Семинар 2. Методы оптимизации.
  • Семинар 3. Методы обработки данных.
  • Семинар 4. Бустинг.
  • Семинар 5. Матричные разложения.
  • Семинар 6. Нейронные сети.

3 курс. Модуль 2. "Прикладной статистический анализ"

  • Семинар 1. Распределения и статистики.
  • Семинар 2. Проверка гипотез.
  • Семинар 3. Анализ зависимостей.
  • Семинар 4. Регрессия.
  • Семинар 5. Прогнозирование временных рядов.
  • Семинар 6. Множественная проверка гипотез.