最近跟新:
- 2020.09.18 更新文本检测说明文档
- 2020.09.12 更新DB,pse,pan,sast,crnn训练测试代码和预训练模型
目前已完成:
接下来计划:
- 训练通用化ocr模型
- 模型转onnx及调用测试
- 模型压缩(剪枝和量化)
- 模型蒸馏
- tensorrt部署
- 手机端部署
训练只在ICDAR2015文本检测公开数据集上,算法效果如下:
模型 | 骨干网络 | precision | recall | Hmean | 下载链接 |
---|---|---|---|---|---|
DB | ResNet50_7*7 | 85.88% | 79.10% | 82.35% | 下载链接(code:fxw6) |
DB | ResNet50_3*3 | 86.51% | 80.59% | 83.44% | 下载链接(code:fxw6) |
DB | MobileNetV3 | 82.89% | 75.83% | 79.20% | 下载链接(code:fxw6) |
SAST | ResNet50_7*7 | 85.72% | 78.38% | 81.89% | 下载链接(code:fxw6) |
SAST | ResNet50_3*3 | 86.67% | 76.74% | 81.40% | 下载链接(code:fxw6) |
PSE | ResNet50_7*7 | 0% | 0% | 0% | 下载链接(code:fxw6) |
PSE | ResNet50_3*3 | 0% | 0% | 0% | 下载链接(code:fxw6) |
PAN | ResNet18_7*7 | 81.80% | 77.08% | 79.37% | 下载链接(code:fxw6) |
PAN | ResNet18_3*3 | 83.78% | 75.15% | 79.23% | 下载链接(code:fxw6) |
image
│ .jpg
│ .jpg
│ ...
需要一个train_list.txt , 格式:图片绝对路径+\t+label。 具体可参照项目中data/example中例子。如果训练过程中需要做验证,需要制作相同的数据格式有一个test_list.txt。
- 修改./config中对应算法的yaml中参数,基本上只需修改数据路径即可。
- 在./tools/rec_train.py最下面打开不同的config中的yaml对应不同的算法
- 运行下面命令
python3 ./tools/rec_train.py
- 运行下面命令
python3 ./tools/rec_infer.py
- https://github.com/PaddlePaddle/PaddleOCR
- https://github.com/whai362/PSENet
- https://github.com/whai362/pan_pp.pytorch
- https://github.com/WenmuZhou/PAN.pytorch
- https://github.com/xiaolai-sqlai/mobilenetv3
- https://github.com/BADBADBADBOY/DBnet-lite.pytorch
- https://github.com/BADBADBADBOY/Psenet_v2
- https://github.com/BADBADBADBOY/pse-lite.pytorch