Привет! В этом репозитории ты найдешь материалы для изучения основ по Машинному обучению.
Практики и лабораторные построены таким образом, что материал перемешан с заданиями и выкладками кода, поэтому не забывайте выполнять по ходу ячейки с кодом (Shift+Enter), чтобы отображать иллюстрации! Задания представлены в виде мест, где нужно вместо комментария #TODO
написать код или что-то обсудить/разобрать. Не бойтесь писать прямо в ноутбуке! Успехов, у вас все получится!
FAQ - может ответ на вопрос найдется здесь
Есть два варианта:
- Вы можете открывать ноутбуки на платформе Google Colab и там их выполнять и сохранять у себя в репоитории. Для этого необходимо открыть блокнот, в качестве источника выбрать GitHub и ввести URL этой страницы: https://github.com/KaiL4eK/ml_edu. В результате откроется список с ноутбуками, любой из которых можно открыть!
- Или можете установить себе на компьютер среду Anaconda и после чего включить сервер Jupyter (или Jupyter-lab). После включения по локальному адресу http://localhost:8888 (или http://localhost:8889) будет доступна среда разработка Jupyter. Чтобы открыть ноутбуки курса вам нужно любым доступным способом скачать репозиторий (например с помощью GitHub Desktop) и далее открыть их через Jupyter.
- 00_Python.ipynb - ноутбук практики по самым-самым основам языка Python;
- 01_Numpy.ipynb - ноутбук по основным возможностям фреймворка
numpy
(работа с матрицами); - 02_Matplotlib.ipynb - ноутбук по основным возможностям фреймворка
matplotlib
(визуализация данных); - 03_Pandas.ipynb - ноутбук по основным возможностям фреймворка
pandas
(работа с табличными данными); - 04_Seaborn.ipynb - ноутбук по основным возможностям фреймворка
seaborn
(еще один фреймворк визуализации);
- 11_Regression.ipynb - ноутбук практики по задаче регрессии;
Познакомьтесь с понятием задачи определения регрессии, основами обучения моделей с помощью градиентного спуска, а также некоторыми особенностями модели линейной регрессии!
- 12L_Regression.ipynb - ноутбук лабораторной по задаче регрессии;
Попробуйте себя в решении задачи определения цены дома! Первый раз работаете с настоящими данными? Не бойтесь - постараемся вместе разобраться с тем, что и как делать!
- 21_Classification.ipynb - ноутбук практики по задаче классификации;
- 22_Classification.ipynb - продолжение разбора задачи классификации;
Другой задачей в обучении с учителем является задача классификации - давайте пробовать!
- 23L_Classification.ipynb - ноутбук лабораторной по задаче классификации;
Вам нравятся цветочки? Давайте попробуем разобраться, где какой ирис!
-
31_RandomForest.ipynb - знакомимся с моделью на основе деревьев;
-
32L_RandomForest.ipynb - решаем, кто выживет на Титанике;
-
41_GradientBoosting.ipynb - стараемся разобраться с тем, как работает градиентный бустинг;
-
42L_GradientBoosting.ipynb - еще сильнее исследуем Титаник;
-
51L_NB_Text.ipynb - а что делать с текстом в ML;
-
61_NeuralNetworks.ipynb - первое знакомство с нейросетями;
-
62_CNN.ipynb - беремся обрабатывать изображения с помощью сверточных нейросетей;
-
63L_CNN.ipynb - вот и подошли к долгожданным кошечкам и собакам;
Одним из самых простых способов работы с материалами является использувание сервиса Google Colab, в котором вы выбираете источник GitHub, вводите URL этой страницы или имя KaiL4eK и далее выбираете нужный ноутбук.
- notebooks - директория с ноутбуками в последовательности рекомендованного изучения;
- datasets - директория с данными, которые использованы в ходе изучения;
- Адаптивный тренажер https://stepik.org/course/512
- Курс по Python https://stepik.org/course/431
- Курс по основам http://pythontutor.ru/
- Книга Head First Python https://yadi.sk/i/kl-028v2t-ZgpA
- Книга A Byte of Python https://yadi.sk/i/mNLloJCrIpitTw
- Книга Dive into Python3: https://diveintopython3.net/
- Книга Майкла Доусона https://yadi.sk/i/59X2i1r1gA2Wkg
- Платформы с задачками:
-
Очень крутая статья https://eldf.ru/machine-learning-base-article
-
Курс от ODS: https://habr.com/ru/company/ods/blog/322626/ | https://mlcourse.ai/
-
Некоторые полезные книжки: https://yadi.sk/d/uFG719fi1IM6HA?w=1
-
Еще курсы по ML:
- https://stepik.org/course/4852/syllabus
- https://stepik.org/course/401/syllabus (Нейросети)
- https://www.coursera.org/learn/machine-learning (Andrew Ng)
- https://www.coursera.org/specializations/deep-learning (Andrew Ng)
- https://yandexdataschool.ru/ (Яндекс ШАД)
-
ODS: https://ods.ai/
-
arXiv: https://arxiv.org/
-
Kaggle: https://www.kaggle.com/
-
Reddit/ML: https://www.reddit.com/r/MachineLearning/
- Великолепный ресурс от автора Adrian Rosebrock: https://www.pyimagesearch.com/
- Книга по OpenCV версии 3 в оригинале: https://yadi.sk/i/BsAV1O0HPY2XjQ
- Задача предсказания выживших на Титанике (классификация): https://www.kaggle.com/c/titanic
- Предсказываем цену дома (регрессия): https://www.kaggle.com/c/house-prices-advanced-regression-techniques
- Определяем цифру, которая нарисована на картинке (классификация): https://www.kaggle.com/c/digit-recognizer
- Определяем ядовитые грибы: https://www.kaggle.com/uciml/mushroom-classification
- Пора уже разобраться, что изображено на картинке - кошка или собака: https://www.kaggle.com/c/dogs-vs-cats