- Семинары проведены Евгением Ковалевым: https://github.com/KovalevEvgeny
- Лекции прочитаны Евгением Соколовым: https://github.com/esokolov
В этом курсе были изучены линейные модели и решающие деревья — два наиболее распространенных вида моделей в анализе данных. Значительное влияние было уделено тому, как правильно применять данные методы к различным видам данных, как измерять и оценивать их качество. На семинарах и в домашних заданиях были решены реальные задачи — фильтрация спама, оценивание стоимости жилья или распознавание рукописных цифр.
- numpy
- pandas
- matplotlib.pyplot
- sklearn (scikit-learn)
- statsmodel
- ntlk
- pymystem3
- pymorphy2
- re
- seaborn
- collections