Интеллектуальный анализ данных (Data Mining) - это процесс обнаружения в "сырых" данных конкретных знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Распространение информационных технологий привело к детальному протоколированию всех процессов бизнеса, производства и жизни человека. Это позволило оперативно собирать и накапливать огромные массивы данных, анализ которых является нетривиальной проблемой, но приносит колоссальную пользу. Можно привести множество примеров уже существующих интеллектуальных систем - от поисковых систем в Интернете до распознавания речи и управления компьютером жестами. Несмотря на достигнутые успехи, большинство проблем анализа данных являются открытыми, и можно ожидать бурного прогресса в этой области на протяжении ближайших 20-30 лет и, как следствие, востребованность специалистов, знакомых с основами интеллектуального анализа данных.
- "Введение в программирование"
- "Введение в анализ данных"
- "Современные методы машинного обучения"
- "Прикладные задачи анализа данных"
- Семинар 1. Введение в программирование. Знакомство c интерпретатором и со средой разработки PyCharm.
- Семинар 2. Простые типы данных. Числа и операции над ними. Условный оператор.
- Семинар 3. Циклы.
- Семинар 4. Строки. Алгоритмы на строках.
- Семинар 5. Списки и кортежи.
- Семинар 6. Словари. Множества.
- Семинар 7. Функции. Рекурсия.
- Семинар 8. Работа с файлами.
- Семинар 9. Контрольная работа.
- Семинар 10. Алгоритмы. Сортировка и поиск. Задачи на линейный и бинарный поиск.
- Семинар 11. Структуры данных. Задачи на использование различных структур данных хранения.
- Семинар 12. Элементарные задачи на графы. Способы задания графов. Обход в глубину. Обход в ширину.
- Семинар 13. Работа с библиотеками NumPy, Matplotlib, Seaborn.
- Семинар 14. Работа с библиотекой Pandas.
- Семинар 15. Работа со стандартной библиотекой.
- Семинар 1. Введение в машинное обучение.
- Семинар 2. Python для анализа данных. Средства визуализации. Pandas, Matplotlib, Seaborn.
- Семинар 3. Линейная алгебра и Python. NumPy, SciPy.
- Семинар 4. Математический анализ и Python. SymPy.
- Семинар 5. Теория вероятностей и Python.
- Семинар 6. Математическая статистика и Python.
- Семинары 7 и 8. Линейные модели в машинном обучении.
- Семинары 9 и 10. Оценка качества алгоритмов машинного обучения.
- Семинары 11 и 12. Композиции алгоритмов. Случайный лес и бустинг.
- Семинары 13 и 14. Продвинутые методы классификации и регрессии. Xgboost. Блендинг.
- Семинары 15 и 16. Обучение без учителя.
- Семинар 1. Ядра и метод опорных векторов.
- Семинар 2. Методы оптимизации.
- Семинар 3. Методы обработки данных.
- Семинар 4. Бустинг.
- Семинар 5. Матричные разложения.
- Семинар 6. Нейронные сети.
- Семинар 1. Распределения и статистики.
- Семинар 2. Проверка гипотез.
- Семинар 3. Анализ зависимостей.
- Семинар 4. Регрессия.
- Семинар 5. Прогнозирование временных рядов.
- Семинар 6. Множественная проверка гипотез.