OCR项目实战（一）：手写汉语拼音识别

项目介绍：

本项目基于深度学习的手写汉语拼音识别方法研究与实现。项目采用Pytorch框架，整体采用主流深度学习文字识别算法CRNN+CTC方法，项目流程主要分为数据集采集及标注，算法构建、模型训练、预测与评估等。后续会补充PaddleOCR版本的手写汉语拼音识别，将引入更多模型测试，并结合数据增强手段提升模型泛化性。

📝项目讲解：https://blog.csdn.net/qq_36816848/article/details/128951065

✨欢迎订阅专栏，欢迎加群互相交流，q群：704932595 , 群内将分享更多大数据与人工智能专业资料!!!!

1.首先将制作好的图片放入data目录下，图片名按具体写的拼音命名，格式jpg。 2.执行pic_to_txt.py文件，生成用于文字识别的图片及标注信息all_pic.txt，内容需要包含图片路径名+拼音，\t分割。 3.运行split.py数据集脚本将图片总数量按9:1比例 (将all_pic.txt分别生成train.txt 和test.txt) 4.将txt格式转为lmdb格式数据集执行create_lmdb，得到train和testd lmdb文件夹，将两个路径替换train.py里的训练及测试路径。 5.运行train.py训练，跑一定时间将模型保存运行demo进行测试。

算法介绍：

1.CRNN+CTC (vgg为特征提取网络)

2.CRNN+Attention (resnet为特征提取网络)

欢迎Fork，后续将更新更多CV相关项目！

csharp2012/Pinyin_recognize

OCR项目实战（一）：手写汉语拼音识别