/ML_deploy

Primary LanguageJupyter Notebook

Деплой ML модели в продакшен

Этот репозиторий содержит примеры кода к серии видеолекций "Деплой ML модели". Обсудим, что делать после того, как вы обучили модель, и как развернуть модель в проде.

Примерный план:

О чём поговорим:

  • Создание простой модели мультиклассовой классификации в Jupyter Notebook;
  • Перенос в python скрипт;
  • Пакетная обработка данных;
  • Онлайн обработка данных, REST API сервис; (in progress)
  • Docker контейнеризация; (in progress)

Структура репозитория

  • data - обучающие данные;
  • models - обученные сериализованные модели;
  • notebooks - папка для тетрадок Jupyter Notebooks;
  • src - код приложения.

Как воспользоваться репозиторием:

  1. Убедитесь, что на вашем компьютере установлен Python и все необходимые пакеты (см. файл requirements.txt).
  2. Склонировать репозиторий на ваш компьютер
    git clone https://github.com/PhySci/ML_deploy.git
  3. Скачать файл с тренировочными данными train.csv с официальной страницы датасета и положить его в папку data
  4. Выполнить все ячейки в тетрадке notebooks/1.ipynb; разобраться, что делается в каждой из них. Как результат, в папке models/v1 должны появиться сериализованные модели (файлы с расширением pcl).
  5. Запустить файл src/batch.py

Обратная связь

Если у вас остались вопросы или вы хотите предложить тему для следующего видео, то напишите об этом в комментариях к опубликованным видео (например, здесь), либо отправьте мне сообщение в Телеграм.