- 📚 Библиотека ML-специалиста,
- По темам: линейная алгебра, тервер, Латех и т.д. + темы из программы курса,
- Онлайн-курсы (MOOC).
- Машинное обучение: вводная лекция – К. В. Воронцов;
- Математические методы обучения по прецедентам (теория обучения машин) – К. В. Воронцов;
- Репозиторий с конспектами, кодом и прочими материалами к семинарам по машинному обучению ВМК МГУ;
- Пост на reddit: Machine Learning Books;
- 100+ Free Data Science Books – более 100 бесплатных книг по Data Science;
- 100 репозиториев по машинному обучению;
- awesome-machine-learning;
- Блоги по датасаенс-тематике;
- People tweeting about ML and AI — на кого подписаться в Твиттере;
- Machine Learning Resource Guide;
- 17 ресурсов по машинному обучению от Типичного Программиста;
- 51 идея для тренировочных задачек (toy data problem) в Data Science;
- Dive into Machine Learning ( repo on github) with Python Jupyter notebook and scikit-learn;
- Data Science Interview Questions — огромный список вопросов для подготовки к интервью на позицию data scientist'а;
- Много книг по NLP (Natural Language Processing);
- Список открытых источников данных, на которых можно найти бесплатные датасеты;
- Для фанатов reddit.com — полезные и весёлые сабреддиты по машинному обучению и смежным темам.
Литература для поступления в ШАД 🔸 Рекомендации от преподавателей курса «Математика и Python» 🔸 Подборка научпоп-книг
- Applied Predictive Modeling – M. Kuhn, K. Johnson (2013);
- Bayesian Reasoning and Machine Learning - D.Barber (2015);
- Core Concepts in Data Analysis: Summarization, Correlation and Visualization - Boris Mirkin;
- A Course in Machine Learning - Hal Daumé III;
- Data Mining: Concepts and Techniques - Jiawei Han et. al.;
- Data Mining and Analysis. Fundamental Concepts and Algorithms - M.J.Zaki, W.Meira Jr (2014);
- Data Science For Dummies – Lillian Pierson (2015);
- Doing Data Science;
- Frequent Pattern Mining - Charu C Aggarwal, Jiawei Han (eds.);
- Gaussian Processes for Machine Learning - Carl E. Rasmussen, Christopher K. I. Williams;
- Inductive Logic Programming: Techniques and Applications - Nada Lavrac, Saso Dzeroski;
- Information Theory, Inference and Learning Algorithms – David MacKay;
- Introduction To Machine Learning - Nils J Nilsson (1997);
- The LION Way Machine Learning plus Intelligent Optimization (pdf);
- Machine Learning - Tom Mitchell;
- Machine Learning, Neural and Statistical Classification - D. Michie, D. J. Spiegelhalter;
- Machine Learning. The Art of Science of Algorithms that Make Sense of Data - P. Flach (2012);
- Machine learning cheat sheet - soulmachine (2015);
- Pattern Recognition and Machine Learning - C.M.Bishop (2006);
- Machine Learning in Action - Peter Harrington;
- Probabilistic Programming and Bayesian Methods for Hackers (free);
- R in Action;
- Reinforcement Learning: An Introduction - Richard S. Sutton, Andrew G. Barto;
- Understanding Machine Learning: From Theory to Algorithms;
- Анализ больших наборов данных - перевод Mining Massive Datasets - Jure Leskovec, Anand Rajaraman, Jeff Ullman;
- Машинное обучение — Петер Флах;
- Построение систем машинного обучения — Л. П. Коэльо, В. Ричарт (2016).
- Статистика и теория вероятностей
- Линейная алгебра
- Алгоритмы (в работе)
- Нейронные сети, глубинное обучение, NLP, AI
- Python, IPython, Scikit-learn etc
- Code editors
- LaTeX
- R (в работе)
- Урок про Desicion Trees на scikit-learn.org;
- Логические алгоритмы классификации – К. В. Воронцов;
- Семинары по решающим деревьям – Е. Соколов.
- How to Tune Algorithm Parameters with Scikit-Learn;
- Python and Kaggle: Feature selection, multiple models and Grid Search;
- Grid search and cross-validated estimators на scipy-lectures.org;
- Документация по модулю Grid Search на scikit-learn.org
- Подробнее о логистической регрессии и предсказании вероятностей с ее помощью;
- Семинары по выбору моделей и критериев качества.
- Подробнее о градиентах и градиентном спуске;
- Методичка по методам спуска и градиентам;
- Объяснение градиента (видео) от Andrej Karpathy, отрывок из лекции курса CS231n.
- Подробнее о градиентном бустинге и особенностях его применения к деревьям;
- Ещё о выводе градиентного бустинга для регрессии и классификации.
- Soft K-means – коротко, строго и одновременно понятно.
- Вывод SVM - Заметки оригинального стэнфордского курса Andrew Ng;
- Метод опорных векторов.
- Лекции по искусственным нейронным сетям — К. В. Воронцов;
- Deep Learning - Ian Goodfellow, Yoshua Bengio, and Aaron Courville (2016);
- Neural Networks and Deep Learning – ещё одна бесплатная онлайн-книга.
- Перечень лучших курсов по практически любым областям математики;
- Тонна разнообразных курсов по программированию, алгоритмам, в том числе 14 курсов по ML;
- Coursera:
- 🔹 Machine Learning от Andrew Ng (Stanford University) – самый популярный курс по машинному обучению (осторожно, вместо стандартных Питона или R – Matlab/Octave);
- 🔹 Специализация Машинное обучение от МФТИ и Яндекса. У меня по этой специализации есть аккуратный репозиторий;
- Machine Learning Foundations: A Case Study Approach — очень доходчивый курс, подходит в качестве самого первого курса по ML;
- Practical Predictive Analytics: Models and Methods;
- Calculus: Single Variable Part 1 от University of Pennsylvania;
- Calculus One от The Ohio State University;
- Современная комбинаторика от МФТИ, ведёт Райгородский А.М.;
- Теория вероятностей для начинающих, а также на OpenEdu — курс от МФТИ, ведёт Райгородский А.М.;
- Линейная алгебра от ВШЭ. Курс линейной алгебры для нематематических факультетов, подходит «для быстрого старта»;
- Эконометрика (Econometrics) — 10-недельный курс от ВШЭ;
- Social Network Analysis от University of Michigan;
- Social and Economic Networks: Models and Analysis от Stanford University;
- Introduction to Recommender Systems – восьминедельный курс по рекомендательным системам от университета Миннесоты;
- Специализация Machine Learning от Washington University.
- Udacity:
- Machine Learning Engineer Nanodegree;
- Data Analyst Nanodegree;
- Intro to Machine Learning — this will teach you the end-to-end process of investigating data through a machine learning lens;
- Intro to Descriptive Statistics – подробный курс для новичков;
- Edx:
- Learning from Data – введение в машинное обучение (основная теория, алгоритмы и области практического применения);
- Видеозаписи лекций Школы Анализа Данных;
- Intro to Python for Data Science – основы Python и немного про NumPy;
- 🔹 Курс по статистике на stepic.org — качественное введение в статистику, целиком на русском языке;
- Data Science and Machine Learning Essentials от Microsoft;
- CS231n: Convolutional Neural Networks for Visual Recognition ( repo on github) — отличный десятинедельный курс по нейросетям и компьютерному зрению.