- git clone https://github.com/jetminded/accenture_hackathon_DS.git
- Создание и активация виртуального окружения:
- cd путь к папке Accenture_hackathon
- python -m venv venv
- cd venv/Scripts
- activate.bat
- Скачайте tesseract exe по ссылке: https://github.com/UB-Mannheim/tesseract/wiki Установите файл exe в следующую папку: C:\Program Files\Tesseract- OCR
- Установка зависимостей:
- cd путь к папке Accenture_hackathon
- pip install -r requirements.txt
- Теперь Вы можете запустить один из 3 основных файлов:
- number_detector/detect_train.py - распознавание номера вагона
- rubbish_classifier/inference.py - классификация брака в вагоне
- rubbish_вуеусещк/detect_rubbish.py - детекция брака в вагоне + процент брака
- Обучение классфикатора проходило в google collab и все результаты и визуализации находятся в rubbish_classifier/trainer.ipynb
- В файлах detect_train.py, inference.py и detect_rubbish.py в соответстующие объекты классов нужно передавать пути к интересующему изображенияю.
- Рекомендуется сначала запускать классификатор на обнаружение наличия или отсутствия брака(так как он обучен с высокими метриками accuracy и f1score). В случае если брак на изображении есть, то тогда запускать детектор, чтобы определить где брак и какой процент он составляет от общей площади.