/TeyvatOCR

识别并翻译原神中的提瓦特通用文

Primary LanguagePython

简介

本项目基于EasyOCRABINet 实现,EasyOCR提供文本检测和定位框架,ABINet识别文本内容。

数据集基于米游社''采薇东篱夏''制作的提瓦特字体 使用TextRecognitionDataGenerator 自动生成得到。 数据集生成过程中使用albumentations 库进行数据增强,提高模型泛化能力。

数据集制作

运行命令

cd data_gen
python text_gen.py

生成数据集,缺什么库安装什么就行。

安装依赖库

pip install -r requirements.txt

使用

预训练模型:

链接:https://pan.baidu.com/s/1TrXBIybAO6-WmXHzzn0krw 提取码:e3ah

放入ABINet文件夹中

识别图片

python demo_image.py -p <文件路径>
python demo_image.py -p <文件路径> --step #生成检测视频

识别视频

python demo_video.py -p <文件路径>

识别效果