测试:1.3.1和2.0.0的简体中文模型识别English无间隙
Closed this issue · 1 comments
Mike-XXX commented
hiroi-sora commented
哦哦哦!感谢你的测试。
实际上,v1.3和v2的Paddle中文模型库是同一个,理论上准确度不会有差别。但是经过测试,发现二者确实存在差异。
我再次分析了两版代码,认为很可能是图片数据在程序内部的编码存在差别,进而导致了结果不同。
你可以进行以下步骤来修改内部编码:
- 用记事本打开
UmiOCR-data\py_src\image_controller\image_provider.py
- 找到第98行:
image.save(buffer, "JPEG") # 将 QImage 保存为字节数组
- 将
JPEG
改为PNG
:
image.save(buffer, "PNG") # 将 QImage 保存为字节数组
- 保存、关闭文件。
通过以上步骤,似乎可以减少截图OCR时空格缺失问题发生的机率。你可以试试。