/my_orc_keras_verification_code_identification

本项目实现了ocr主流算法gru/lstm+ctc+cnn架构,进行不定长度验证码识别,达到不分割字符而识别验证码内容的效果。验证码内容包含了大小字母以及数字,并增加点、线、颜色、位置、字体等干扰项。本项目对gru +ctc+cnn、lstm+ctc+cnn、cnn三种架构进行了对比,实践说明同等训练下gru/lstm+ctc+cnn架构准确率和速度均明显优于cnn架构,gru +ctc+cnn优于lstm+ctc+cnn,在实验2500个样本数据200轮训练时,gru +ctc+cnn架构在500样本测试准确率达90.2%。本项目技术能够训练长序列的ocr识别,更换数据集和相关调整,即可用于比如身份证号码、车牌、手机号、邮编等识别任务,也可用于汉字识别。

Primary LanguagePython

my_orc_keras_Identification_verification_code

本项目实现了ocr主流算法lstm+ctc+cnn架构,进行验证码识别,达到不分割字符而识别验证码内容的效果。验证码内容包含了大小字母以及数字。本项目技术能够训练长序列的ocr识别,更换数据集和相关调整,即可用于比如身份证号码、车牌、手机号、邮编等识别任务,也可用于汉字识别。

#环境 为方便初学者使用,环境在 window 下,tensorflow 用 CPU 版 1、 OS Windows 10 x64 2、 Python 3.6.2 3、 Tensorflow 1.8.0 CPU 版 4、 Keras 2.2.0 5、 Opencv 3.4.2

#数据 好多人问数据在哪,我真的想说数据就在源码中。dataset_gen_image.py 这个文件就是数据!

#欢迎大家一起学习讨论