一个基于PyQt5和百度图像识别API的文本检测程序,其中基于pyqt5的截图功能来自项目https://github.com/ianzhao05/textshot
- pytesseract和Tesseract:
textrec-tesseract.py
沿用了textshot中使用tesseract进行识别的方法,需要在https://github.com/tesseract-ocr/tesseract下载安装,如果是Windows系统,可以在https://github.com/UB-Mannheim/tesseract/wiki下载安装预编译版本,并且添加到系统环境路径;pytesseract是python调用接口;如果不需要这个,也可以删除相关代码; - baidu-aip: 百度提供的图像识别API;
- Pillow
- PyQt5
安装tesseract后可以下载很多语言模型,本程序默认使用简体中文(chi_sim
),也可以选择chi_tra
,eng
等,代码修改位置在第277行.
$ python textrec-tesseract.py
自己去百度云申请图像文本检测的开发接口,得到id,秘钥等信息,修改代码,填入自己申请的信息:
# 手动输入百度图像处理API接口,同时取消注释
self.APP_ID = None
self.API_KEY = None
self.SECRET_KEY = None
self.aipOcr = AipOcr(self.APP_ID, self.API_KEY, self.SECRET_KEY)
如果不在程序中硬编码,则需要在运行程序后进入设置界面设置
$ python textrec-aip.py