/ml_edu

Repository with some ML practice notebooks

Primary LanguageJupyter NotebookCreative Commons Zero v1.0 UniversalCC0-1.0

Обучающие ноутбуки по Machine Learning

Привет! В этом репозитории ты найдешь материалы для изучения основ по Машинному обучению.

Содержание

Как работать с материалами

Практики и лабораторные построены таким образом, что материал перемешан с заданиями и выкладками кода, поэтому не забывайте выполнять по ходу ячейки с кодом (Shift+Enter), чтобы отображать иллюстрации! Задания представлены в виде мест, где нужно вместо комментария #TODO написать код или что-то обсудить/разобрать. Не бойтесь писать прямо в ноутбуке! Успехов, у вас все получится!

FAQ - может ответ на вопрос найдется здесь

Что мне делать с ноутбуками?

Есть два варианта:

  • Вы можете открывать ноутбуки на платформе Google Colab и там их выполнять и сохранять у себя в репоитории. Для этого необходимо открыть блокнот, в качестве источника выбрать GitHub и ввести URL этой страницы: https://github.com/KaiL4eK/ml_edu. В результате откроется список с ноутбуками, любой из которых можно открыть!
  • Или можете установить себе на компьютер среду Anaconda и после чего включить сервер Jupyter (или Jupyter-lab). После включения по локальному адресу http://localhost:8888 (или http://localhost:8889) будет доступна среда разработка Jupyter. Чтобы открыть ноутбуки курса вам нужно любым доступным способом скачать репозиторий (например с помощью GitHub Desktop) и далее открыть их через Jupyter.

Базовые практики

  • 00_Python.ipynb - ноутбук практики по самым-самым основам языка Python;
  • 01_Numpy.ipynb - ноутбук по основным возможностям фреймворка numpy (работа с матрицами);
  • 02_Matplotlib.ipynb - ноутбук по основным возможностям фреймворка matplotlib (визуализация данных);
  • 03_Pandas.ipynb - ноутбук по основным возможностям фреймворка pandas (работа с табличными данными);
  • 04_Seaborn.ipynb - ноутбук по основным возможностям фреймворка seaborn (еще один фреймворк визуализации);

Основные материалы

Познакомьтесь с понятием задачи определения регрессии, основами обучения моделей с помощью градиентного спуска, а также некоторыми особенностями модели линейной регрессии!

  • 12L_Regression.ipynb - ноутбук лабораторной по задаче регрессии;

Попробуйте себя в решении задачи определения цены дома! Первый раз работаете с настоящими данными? Не бойтесь - постараемся вместе разобраться с тем, что и как делать!

Другой задачей в обучении с учителем является задача классификации - давайте пробовать!

Вам нравятся цветочки? Давайте попробуем разобраться, где какой ирис!

  • 31_RandomForest.ipynb - знакомимся с моделью на основе деревьев;

  • 32L_RandomForest.ipynb - решаем, кто выживет на Титанике;

  • 41_GradientBoosting.ipynb - стараемся разобраться с тем, как работает градиентный бустинг;

  • 42L_GradientBoosting.ipynb - еще сильнее исследуем Титаник;

  • 51L_NB_Text.ipynb - а что делать с текстом в ML;

  • 61_NeuralNetworks.ipynb - первое знакомство с нейросетями;

  • 62_CNN.ipynb - беремся обрабатывать изображения с помощью сверточных нейросетей;

  • 63L_CNN.ipynb - вот и подошли к долгожданным кошечкам и собакам;

Инструменты

Одним из самых простых способов работы с материалами является использувание сервиса Google Colab, в котором вы выбираете источник GitHub, вводите URL этой страницы или имя KaiL4eK и далее выбираете нужный ноутбук.

Структура директорий

  • notebooks - директория с ноутбуками в последовательности рекомендованного изучения;
  • datasets - директория с данными, которые использованы в ходе изучения;

Ресурсы

Python

ML

CV

Полезные для начала соревнования Kaggle