Этот репозиторий содержит примеры кода к серии видеолекций "Деплой ML модели". Обсудим, что делать после того, как вы обучили модель, и как развернуть модель в проде.
О чём поговорим:
- Создание простой модели мультиклассовой классификации в Jupyter Notebook;
- Перенос в python скрипт;
- Пакетная обработка данных;
- Онлайн обработка данных, REST API сервис; (in progress)
- Docker контейнеризация; (in progress)
- data - обучающие данные;
- models - обученные сериализованные модели;
- notebooks - папка для тетрадок Jupyter Notebooks;
- src - код приложения.
- Убедитесь, что на вашем компьютере установлен Python и все необходимые пакеты (см. файл requirements.txt).
- Склонировать репозиторий на ваш компьютер
git clone https://github.com/PhySci/ML_deploy.git
- Скачать файл с тренировочными данными train.csv с официальной страницы датасета и положить его в папку data
- Выполнить все ячейки в тетрадке notebooks/1.ipynb; разобраться, что делается в каждой из них. Как результат, в папке models/v1 должны появиться сериализованные модели (файлы с расширением pcl).
- Запустить файл src/batch.py
Если у вас остались вопросы или вы хотите предложить тему для следующего видео, то напишите об этом в комментариях к опубликованным видео (например, здесь), либо отправьте мне сообщение в Телеграм.