-
系统功能:
抓取网页上的验证码,对验证码图片进行去噪,二值化,分割,再利用神经网络的技术实现对验证码的识别。
-
主要技术:
Python编程,利用PIL,numpy,pybrain
-
主要步骤:
-
预处理(去背景,降噪,二值化):
-
图片分割,分类组成字模库:
- 观察知字符之间几乎无粘黏,可将图片像素垂直投射成一维列表,记录每一列黑色像素总和。
- 一维列表波峰可表示为字符,波谷为字符间隙。通过不断尝试选取最合适的波峰波谷值来分割图片。
- 将分割好的字符分类,分别存放在文件夹中,组成字模库。
-
建立训练集和测试集进行神经网络训练,使误差达到理想值:
-
运行识别程序,验证识别准确性:
第一次提交代码到GitHub,请多多指教 😝