本项目用自己想法实现阿里云栖大会中,阿里团队提到的ctc+centerloss来解决相近字的问题 pdf百度网盘链接: https://pan.baidu.com/s/13370jLcBblmqvwfprHPYXw 提取码: mejj
pip install -r requirements.txt
- 链接: https://pan.baidu.com/s/1H8YyRVN9keOQuQ-v3nwArg 提取码: vs3g
- 1 先用https://github.com/Sanster/tf_crnn 的crnn训练
- 2.对原始crnn训练到val acc 到95% loss 0.1左右,或者直至有满意的效果。
- 3.用gen_CR_data.py,用上面训练好的模型文件进行新的label生成
- 4.修改 crnn.py 文件 109行 centerloss 的权重为0。00001进行crnn 的训练
python train.py
- 5.训练到val acc 95% 或者到自己对效果满意
python test.py
- 'A1200622287g4811330009'
- '1 79.00 30.02 30.02'
- '令:怜,伶,邻, 冷,领,龄,铃,岭,玲,拎'
- '逢:缝,蓬,篷,峰,锋,逢,蜂'
- '成一一威,风一一凤,干一一千,土一一士,元一一无,他一一地'
- '素一一索,朱一一宋,都一一郡,汨一一汩,李一一季,直一一真,'
训练数据与预训练模型 关注微信公众账号 hulugeAI 留言:ctc 获取 线下wx交流群入门券
copy right huluge