/PytorchOCR

基于Pytorch的OCR工具库,支持常用的文字检测和识别算法

Primary LanguagePython

PytorchOCR

简介

PytorchOCR旨在打造一套训练,推理,部署一体的OCR引擎库

更新日志

  • 2020.07.01 添加 添加新算法文档
  • 2020.06.29 添加检测的mb3和resnet50_vd预训练模型
  • 2020.06.25 检测模块的训练和预测ok
  • 2020.06.18 更新README
  • 2020.06.17 识别模块的训练和预测ok

todo list

  • crnn训练与python版预测
  • DB训练与python版预测
  • imagenet预训练模型
  • 识别模型预训练模型
  • DB通用模型
  • 手机端部署

环境配置

需要的环境如下

  • pytorch 1.4+
  • torchvision 0.5+
  • gcc 4.9+ (pse,pan会用到)

快速安装环境

pip3 install -r requirements.txt

模型下载

链接:https://pan.baidu.com/s/1oCWJVyEpGAeagE4EwoV0kA 提取码:vvvx

文档教程

文本检测算法

PytorchOCR开源的文本检测算法列表:

在ICDAR2015文本检测公开数据集上,算法效果如下:

模型 骨干网络 precision recall Hmean 下载链接
DB MobileNetV3 84.63% 66.14% 74.23% 见百度网盘

文本识别算法

PytorchOCR开源的文本识别算法列表:

结果展示

检测

贡献代码

我们非常欢迎你为PytorchOCR贡献代码,也十分感谢你的反馈。

相关仓库