/billclassification

using CNN doing bill-classification

Primary LanguagePython

billclassification 利用CNN实现票据分类

依赖库

python 3.5
pytorch 0.3.0
matplotlib
numpy

数据集

票据图像总共五类:车票、定额发票、机打发票、机打小票和财务报销单,共765张。
下载链接:https://pan.baidu.com/s/1S2LzHe_DQ35B-KlpoWUBVw
将下载好的压缩包,解压后放在同一文件夹下即可。

标注

标注文件位于 billcalssificaiton/label
格式为 XXXX/XXX.jpg N.数据共5类 所以N取0-4.
未手工划分训练集和测试集,训练集和测试集由算法随机生成.

训练

提供三种训练方法:1、100次随机留出;2、10次10折交叉检验;3、单次训练。
1、2的训练、测试数据皆由标注文件生成,会保存每次实验中最高准确率的结果可用做3的输入。

结果

基于交叉检验中最好结果--准确率折线图

基于交叉检验中最好结果--损失折线图

基于交叉检验中最好结果--5类准确率柱状图

准确率都可以达到100%,可以认为是训练集的数据分布,包含了测试集的数据分布。