English README (out-dated
).
cnocr 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持中文、英文的常见字符识别,自带了多个训练好的识别模型,安装后即可直接使用。欢迎扫码加入微信交流群:
作者也维护 知识星球 CnOCR/CnSTD私享群 ,欢迎加入。知识星球私享群会陆续发布一些CnOCR/CnSTD相关的私有资料,包括更详细的训练教程,未公开的模型,使用过程中遇到的难题解答等。本群也会发布OCR/STD相关的最新研究资料。此外,私享群中作者每月提供两次免费特有数据的训练服务。
见 CnOcr在线文档 。
cnocr 主要针对的是排版简单的印刷体文字图片,如截图图片,扫描件等。目前内置的文字检测和分行模块无法处理复杂的文字排版定位。如果要用于场景文字图片的识别,需要结合其他的场景文字检测引擎使用,例如文字检测引擎 cnstd 。
嗯,安装真的很简单。
pip install cnocr
安装速度慢的话,可以指定国内的安装源,如使用豆瓣源:
pip install cnocr -i https://pypi.doubanio.com/simple
注意:请使用 Python3(3.6以及之后版本应该都行),没测过Python2下是否ok。
- 支持图片包含多行文字 (
Done
) - crnn模型支持可变长预测,提升灵活性 (since
V1.0.0
) - 完善测试用例 (
Doing
) - 修bugs(目前代码还比较凌乱。。) (
Doing
) - 支持
空格
识别(sinceV1.1.0
) - 尝试新模型,如 DenseNet,进一步提升识别准确率(since
V1.1.0
) - 优化训练集,去掉不合理的样本;在此基础上,重新训练各个模型
- 由 MXNet 改为 PyTorch 架构(since
V2.0.0
) - 基于 PyTorch 训练更高效的模型
- 支持列格式的文字识别