/Machine_Learning_HSE

Machine Learning in HSE (Minor in Data Science)

Primary LanguageJupyter Notebook

Машинное обучение (Введение в анализ данных)

В этом курсе были изучены линейные модели и решающие деревья — два наиболее распространенных вида моделей в анализе данных. Значительное влияние было уделено тому, как правильно применять данные методы к различным видам данных, как измерять и оценивать их качество. На семинарах и в домашних заданиях были решены реальные задачи — фильтрация спама, оценивание стоимости жилья или распознавание рукописных цифр.

Исходный репозиторий

Страница курса

Основные библиотеки:

  • numpy
  • pandas
  • matplotlib.pyplot
  • sklearn (scikit-learn)
  • statsmodel
  • ntlk
  • pymystem3
  • pymorphy2
  • re
  • seaborn
  • collections