/mlcourse_open

Репозиторий открытого курса OpenDataScience по машинному обучению

Primary LanguageJupyter Notebook

Открытый курс OpenDataScience по машинному обучению

ODS stickers

Основные темы:

  1. Первичный анализ данных с Pandas
  2. Визуальный анализ данных в Python
  3. Классификация, деревья решений и метод ближайших соседей
  4. Линейные модели классификации и регрессии. Кросс-валидация и оценка модели
  5. Композиции: бэггинг, случайный лес. Кривые валидации и обучения
  6. Обучение без учителя: PCA, кластеризация, поиск аномалий
  7. Искусство построения и отбора признаков. Приложения в задачах обработки текста, изображений и гео-данных

Авторы статей и лекторы

Юрий Кашницкий

Программист-исследователь Mail.ru Group, старший преподаватель факультета компьютерных наук ВШЭ, научный сотрудник Международной научно-учебной лаборатории интеллектуальных систем и структурного анализа ВШЭ. В прошлом — разработчик Hadoop, бизнес-аналитик и Java-программист РДТЕХ.

Павел Нестеров

Data Scientist в стартапе, который нельзя называть. Раньше - программист-исследователь Mail.Ru Group в департаменте рекламы, позже в департаменте поиска. Преподавал в Техносфере@Mail.Ru на базе МГУ ВМК. Еще раньше - программист-исследователь в сфере компьютерного зрения, до нейросетевой эпохи, в Aspose ltd. Домашняя страница http://pavelnesterov.info/