一款实验性质的个人向通用安卓移动端在线阅读app小说提取工具。“Germen”源于拉丁语“幼苗”。
注:后面的格式处理已经全部改用Python完成,上面只是大概思路而已。
开发截图与模拟点击的部分。(已完成)
开发OCR部分(已完成)
开发文本处理部分(已完成)
开发主程序(已完成)
调试程序与修复Bug(进行中)
开发GUI(进行中)
- PictureDir :保存截图的路径
- OCROutPaDir:保存OCR生成的文本的路径
- MergeBookDir:保存经过了合并,但是未处理格式的文本文件的路径
- FinalNovelDir:保存经过格式处理的文本文件的路径
- Cycle:每一轮截图-翻页-文字识别的间隔时间,默认为30秒
-
进入Python环境(推荐使用virtualenv或者conda为本项目设置一个专属虚拟环境)(开发环境为Python 3.10)。
-
将下载好的Release压缩包解压(或者git clone),在项目根目录运行
pip install -r requirements.txt -I -i https://pypi.tuna.tsinghua.edu.cn/simple
安装依赖。 -
下载OCR推理模型(ch_PP-OCRv4_det_server_infer和ch_PP-OCRv4_rec_server_infer),并解压后放入models文件夹中,形成下面的结构:
-
运行
python MainProgram.py
启动主程序。 -
按照流程执行操作。
- 在安装依赖中的Paddle(飞浆)时,有可能会因为依赖原因而导致安装失败。推荐按照官方的说明手动安装相关的组件。
- 在每次运行采集时,务必清空OCROutPaDir里残留的OCR文本,以免合成的文本混杂上一次的内容。
- 推荐提高阅读界面的对比度,使用常规字体以获得更高的识别准确率。调整字体大小以提高获取文本的效率。
- 确认设置的模拟点击位置在现在和未来的截屏中不会遮挡文字,否则可能造成OCR识别错误、缺字等。
- 在程序运作时,请不要遮挡窗口,也尽量不要做拖拽操作,以免模拟点击被用户操作覆盖。
- 目前加入了按键模拟翻页,使用之前请在模拟器中设置好按键和点按位置。
- 如果你的模拟器使用了管理员权限运行,那么建议也使用管理员权限运行python执行本程序。
- 如果运行OCR过程中提示缺少cudnn文件,可以参考这篇文章来解决。
- 程序运行时会占用大量内存,请确保计算机的可用内存大于10GB.