/COCO_to_YOLOv8

Converting COCO annotation (CVAT) to annotation for YOLOv8-seg (instance segmentation) and YOLOv8-obb (oriented bounding box detection)

Primary LanguagePythonGNU Affero General Public License v3.0AGPL-3.0

COCO to YOLO converter for instance segmentation (YOLOv8-seg) and oriented bounding box detection (YOLOv8-obb)

The repository allows converting annotations in COCO format to a format compatible with training YOLOv8-seg models (instance segmentation) and YOLOv8-obb models (rotated bounding box detection).

Key usage of the repository -> handling annotated polygons (or rotated rectangles in the case of YOLOv8-obb) exported from the CVAT application in COCO 1.0 format (with the save images mode set to True).

If you use it without CVAT, make sure that your COCO dataset folder has the following structure:

COCO_dataset/
|-- annotations/
|   |-- instances_train.json
|   |-- instances_val.json
|-- images/
|   |-- image1.jpg
|   |-- image2.jpg
|   |-- ...

PS: For the instance segmentation task, Ultralytics YOLO11-seg, YOLOv9-seg and YOLOv5-seg models are also supported (since they have similar annotation format to v8).

Installation:

git clone https://github.com/Koldim2001/COCO_to_YOLOv8.git

cd COCO_to_YOLOv8

pip install -r requirements.txt

How to run the code:

Classic approach with pre-defined train/val/test split from CVAT (Tasks have a defined Subset in CVAT):

python coco_to_yolo.py --coco_dataset="dataset_folder"

Option with automatic split into train and val:

python coco_to_yolo.py --coco_dataset="dataset_folder" --autosplit=True --percent_val=30

List of parameters with explanations that can be passed to the program before running it in the command line interface (CLI):

  --coco_dataset TEXT   Folder with COCO 1.0 format dataset (can be exported
                        from CVAT). Default is "COCO_dataset"

  --yolo_dataset TEXT   Folder with the resulting YOLOv8 format dataset.
                        Default is "YOLO_dataset"

  --print_info BOOLEAN  Enable/Disable processing log output mode. Default is
                        disabled

  --autosplit BOOLEAN   Enable/Disable automatic split into train/val. Default
                        is disabled (uses the CVAT annotations)

  --percent_val FLOAT   Percentage of data for validation when using
                        autosplit=True. Default is 25%

  --help                Show existing options for parsing arguments in the CLI





Russian Version of README:

Репозиторий позволяет преобразовать разметку формата COCO в формат, поддерживаемый для обучения моделей YOLOv8-seg (инстанс сегментация) и YOLOv8-obb (детекция повернутых боксов).

Ключевое применение репозитория -> работа с выгруженной разметкой полигонов (или повернутых прямоугольников в случае с YOLOv8-obb) из приложения CVAT в формате COCO 1.0 (с указанием режима save images = True).

Если же используете без CVAT, то убедитесь перед запуском, что ваша папка с COCO датасетом имеет такую структуру:

COCO_dataset/
|-- annotations/
|   |-- instances_train.json
|   |-- instances_val.json
|-- images/
|   |-- image1.jpg
|   |-- image2.jpg
|   |-- ...

PS: Для задчи инстанс сегментации имеется также поддержка моделей Ultralytics YOLO11-seg, YOLOv9-seg и YOLOv5-seg (так как у них аналогичная разметка с версией v8)

Примеры использования:

Пример использования репозитория для задачи YOLOv8-seg представлен в видео на YouTube - ССЫЛКА
Пример использования репозитория для задачи YOLOv8-obb представлен в видео на YouTube - ССЫЛКА

Установка:

git clone https://github.com/Koldim2001/COCO_to_YOLOv8.git

cd COCO_to_YOLOv8

pip install -r requirements.txt

Как запускать код:

Классический подход c предустановленным в CVAT разделением на train/val/test (у тасок определен Subset):

python coco_to_yolo.py --coco_dataset="dataset_folder" --lang_ru=True

Вариант с авторазделением на train и val:

python coco_to_yolo.py --coco_dataset="dataset_folder" --autosplit=True --percent_val=30 --lang_ru=True

Список параметров с пояснениями, которые можно передать на вход программы перед ее запуском в cli:

  --coco_dataset TEXT   Папка с датасетом формата COCO 1.0 (можно выгрузить из
                        CVAT). По умолчанию "COCO_dataset"

  --yolo_dataset TEXT   Папка с итоговым датасетом формата YOLOv8. По
                        умолчанию "YOLO_dataset"

  --print_info BOOLEAN  Вкл/Выкл режима вывода логов обработки. По умолчанию
                        отключен

  --autosplit BOOLEAN   Вкл/Выкл режима автоматического разделения на
                        train/val. По умолчанию отключен (берет согласно
                        разметке CVAT)

  --percent_val FLOAT   Процент данных на валидацию при выборе режима
                        autosplit=True. По умолчанию 25%

  --lang_ru BOOLEAN     Устанавливает русский язык комментариев, если выбрано 
                        значение True. По умолчанию английский 

  --help                Покажет существующие варианты парсинга аргументов в CLI