VIETNAMESE ARTTEXT OCR - TIU TEAM

Chia bài toán thành 2 task :

Detection : Yolov7

Regconition : Vietocr

Sử dụng thêm ESRGAN thực hiện super resolution cho những ảnh nhỏ, nhòe trước khi cho

Chúng tôi thực hiện argument thêm data, có thể xem thử repo :

DATA ARGUMENT

Cài đặt:

Gitclone repo:

Cài đặt yolov7 theo hướng dẫn tại repo gốc

YOLOV7

link pretrain yolov7 :

Pretrain Yolov7

Train:

bash train.sh

Test:

bash infer.sh

Trường hợp ảnh không nhận dạng được bất kì đối tượng nào,YOLOv7 không lưu lại output của ảnh đó. Nên khắc phục bằng cách thực hiện:

Fill miss file :

bash fill_miss_file.sh

Convert tạo độ:

bash convert.sh

Lưu ý : Thay đổi các đường dẫn trước khi chạy trong các file.sh

Cài đặt vietocr theo hướng dẫn của repo gốc, hoặc build docker image từ dockerfile trong folder vietocr.Chúng tôi đã tích hợp super resolution bằng ESRGAN vào quá trình infer

VIETOCR

train:

python3 train.py

Lưu ý thay đổi đường dẫn config trong file train.py

test :

bash predict.sh

Lưu ý: Thay đổi các tham số trong file.sh

Link pretrain vietocr:

Pretrain Vietocr

trongnk2106/Vietnamese_ArtText_OCR

VIETNAMESE ARTTEXT OCR - TIU TEAM

Chia bài toán thành 2 task :

Detection : Yolov7

Regconition : Vietocr

Sử dụng thêm ESRGAN thực hiện super resolution cho những ảnh nhỏ, nhòe trước khi cho

Chúng tôi thực hiện argument thêm data, có thể xem thử repo :

Cài đặt:

Gitclone repo:

Cài đặt yolov7 theo hướng dẫn tại repo gốc

link pretrain yolov7 :

Train:

Test:

Trường hợp ảnh không nhận dạng được bất kì đối tượng nào,YOLOv7 không lưu lại output của ảnh đó. Nên khắc phục bằng cách thực hiện:

Fill miss file :

Convert tạo độ:

Lưu ý : Thay đổi các đường dẫn trước khi chạy trong các file.sh

Cài đặt vietocr theo hướng dẫn của repo gốc, hoặc build docker image từ dockerfile trong folder vietocr.Chúng tôi đã tích hợp super resolution bằng ESRGAN vào quá trình infer

train:

Lưu ý thay đổi đường dẫn config trong file train.py

test :

Lưu ý: Thay đổi các tham số trong file.sh

Link pretrain vietocr: