пререквизиты )

pip install -r 'requirements.txt'

1. Загрузка JN и DS

на входе задаем в config.ini откуда брать JN и DS

[ingestor]
repo_name = https://raw.githubusercontent.com/truemanD/ML_test/main/
ds_name = historical_dataset.csv
jn_name = jupiter_notebook.ipynb

запускаем модуль ingestor

python ingestor.py

DS и JN расположены в "правильных" местах репозитория

HoTo

В среде Jupiter Notebook в файле ipynb необходимо сделать ряд пометок:

  1. тегом #dataset помечаем строку в ячейке, где осуществляется импорт датасета
wine = pd.read_csv('./../../data/historical_dataset.csv') #dataset
  1. тегами
#test_dataset=X_test
#test_classes=y_test
#train_dataset=X_train
#train_classes=y_train

создаются указатели на переменные с наборами данных для обучения модели и ее тестирования

  1. тегами
#model=sgd

создаются указатели на переменные с обученными моделями

!все указатели должны находиться в тех ячейках, где происходит инициализациия необходимых переменных

2. Конвертация JN в py скрипты

на входе имеем полученные ранее DS и JN. Pадаем в config.ini откуда брать JN и DS

[convertor]
api_template = api.template
jn_name = jupiter_notebook.ipynb
start_port = 5000

запускаем модуль convertor

python convertor.py

3. Локальное обучение модели

на входе имеем сгенерированный файл train.py и данные для обучения модели в директории train/data

пререквизиты для обучения )

pip install -r 'train/src/scripts/requirements.txt'

запускаем модуль train

python train/src/scripts/train.py

4. Локальное использование модели

пререквизиты для использования )

pip install -r 'predict/src/scripts/requirements.txt'

запускаем модуль predict

python predict/src/scripts/<<model_name>>_predict.py

пререквизиты для использования api)

pip install -r 'predict/src/api/requirements.txt'

запускаем модуль predict с api

python predict/src/api/<<model_name>>.py

5. Генерация сценария расчета(DAG) и политик доступа(REGO)

запускаем модуль генерации DAG

python generator.py

6. Сборка модуля обучения и модуля использования модели