Управление данными и моделями с помощью DVC
Открытый урок курса MLOps
Вы узнаете:
- Как использовать DVC для версионирования данных
- Как обеспечить совместный доступ к данным через S3
- Как версионировать модели и храненить артефакты в DVC
- Когда лучше подойдет DVC, а когда MLFlow
- Как сделать воспроизводимое обучение моделей
Кому подходит этот урок:
- Дата-сайентистам, которые хотят научиться выводить свои модели в прод
- Дата-инженерам, которые обеспечивают версионирование данных
- ML-инженерам, решающим проблемы хранения и версионирования моделей
Результат урока:
- Научитесь настраивать в git репозитории DVC и хранить артефакты на S3
- Переключаться между версиями артефактов и загружать их во внешнее хранилище
- Создавать воспроизводимые конвейеры обучения моделей с помощью DVC Pipelines