DL-deeplearning-CV-computer-vision-traffic-signs-recognition-GTSRB-dataset

Keras & CNN

【数据集】：德国GTSRB数据集，由于官网为ppm 格式，不太好进行操作，感谢一些前辈提供了pickle 格式的数据集【网络结构】：卷积神经网络VGG16 + 自己在最后多加了两层【图像预处理部分】：采用了IMAGE NET 竞赛中常用的图像去均值操作【模型的保存与权重读取】：根据KERAS 框架中的model 函数进行保存，调用，且读取权重。

【使用：model.summary() 所打印出的模型的概况】

"C:\Program Files\Anaconda3\python.exe" "C:/Users/c8780/Desktop/traffic signs/查看保存好的MODEL.py" C:\Program Files\Anaconda3\lib\site-packages\h5py_init_.py:36: FutureWarning: Conversion of the second argument of issubdtype from float to np.floating is deprecated. In future, it will be treated as np.float64 == np.dtype(float).type. from ._conv import register_converters as _register_converters Using TensorFlow backend. 2018-11-19 14:24:33.577698: I T:\src\github\tensorflow\tensorflow\core\platform\cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2

Layer (type) Output Shape Param #

input_1 (InputLayer) (None, 224, 224, 3) 0

block1_conv1 (Conv2D) (None, 224, 224, 64) 1792

block1_conv2 (Conv2D) (None, 224, 224, 64) 36928

block1_pool (MaxPooling2D) (None, 112, 112, 64) 0

block2_conv1 (Conv2D) (None, 112, 112, 128) 73856

block2_conv2 (Conv2D) (None, 112, 112, 128) 147584

block2_pool (MaxPooling2D) (None, 56, 56, 128) 0

block3_conv1 (Conv2D) (None, 56, 56, 256) 295168

block3_conv2 (Conv2D) (None, 56, 56, 256) 590080

block3_conv3 (Conv2D) (None, 56, 56, 256) 590080

block3_pool (MaxPooling2D) (None, 28, 28, 256) 0

block4_conv1 (Conv2D) (None, 28, 28, 512) 1180160

block4_conv2 (Conv2D) (None, 28, 28, 512) 2359808

block4_conv3 (Conv2D) (None, 28, 28, 512) 2359808

block4_pool (MaxPooling2D) (None, 14, 14, 512) 0

block5_conv1 (Conv2D) (None, 14, 14, 512) 2359808

block5_conv2 (Conv2D) (None, 14, 14, 512) 2359808

block5_conv3 (Conv2D) (None, 14, 14, 512) 2359808

block5_pool (MaxPooling2D) (None, 7, 7, 512) 0

flatten_1 (Flatten) (None, 25088) 0

dense_1 (Dense) (None, 32) 802848

dropout_1 (Dropout) (None, 32) 0

dense_2 (Dense) (None, 43) 1419

Total params: 15,518,955 Trainable params: 15,518,955 Non-trainable params: 0

Process finished with exit code 0

【使用文件：返回权重张量列表.py】 block1_conv1/kernel:0 (3, 3, 3, 64) block1_conv1/bias:0 (64,) block1_conv2/kernel:0 (3, 3, 64, 64) block1_conv2/bias:0 (64,) block2_conv1/kernel:0 (3, 3, 64, 128) block2_conv1/bias:0 (128,) block2_conv2/kernel:0 (3, 3, 128, 128) block2_conv2/bias:0 (128,) block3_conv1/kernel:0 (3, 3, 128, 256) block3_conv1/bias:0 (256,) block3_conv2/kernel:0 (3, 3, 256, 256) block3_conv2/bias:0 (256,) block3_conv3/kernel:0 (3, 3, 256, 256) block3_conv3/bias:0 (256,) block4_conv1/kernel:0 (3, 3, 256, 512) block4_conv1/bias:0 (512,) block4_conv2/kernel:0 (3, 3, 512, 512) block4_conv2/bias:0 (512,) block4_conv3/kernel:0 (3, 3, 512, 512) block4_conv3/bias:0 (512,) block5_conv1/kernel:0 (3, 3, 512, 512) block5_conv1/bias:0 (512,) block5_conv2/kernel:0 (3, 3, 512, 512) block5_conv2/bias:0 (512,) block5_conv3/kernel:0 (3, 3, 512, 512) block5_conv3/bias:0 (512,) dense_1/kernel:0 (25088, 32) dense_1/bias:0 (32,) dense_2/kernel:0 (32, 43) dense_2/bias:0 (43,)

【关于图片normalize 操作和没有进行normalize 操作的区别】没有进行的原始图片【选择了测试集中的前三张】图片大小为：32323 进行了normalize 的图片【同样选择了测试集中的前三长】图片大小为：2242243

【一些小小的思考：】 1.pickle 格式的文本，能否更直观的进行查看？ 2.imagenet 中所保存的权重，如何去评估其在不同案例中的性能？ 3.关于vgg16模型的自动保存的权重，之前是有自己下载放到目录中，今天实践了另一种方式，是程序的运行中，如果没有提前下好放到目录中的话，程序运行的过程中，仍旧会自动下载。 4. batch_size 和learning rate 之间的关系& SGD， batch GD两种算法的对比；（1）因为batch GD这种方法每更新一次参数都要把数据集里的所有样本都看一遍，计算量开销大，计算速度慢，不支持在线学；所以我采用了SGD算法：stochastic gradient descent，采用了非常非常小的学习率：0.001，而且由于现代的计算框架CPU/GPU的多线程工作，单个sample往往很难占满CPU/GPU的使用率，导致计算资源浪费，所以目前想要用：mini batch.小批的梯度下降，这种方法把数据分为若干个批，按批来更新参数，这样，一个批中的一组数据共同决定了本次梯度的方向，下降起来就不容易跑偏，减少了随机性。另一方面因为批的样本数与整个数据集相比小了很多，计算量也不是很大。 (2)根据现有结果的一些发现：随着 Batch_Size 增大，处理相同数据量的速度越快。随着 Batch_Size 增大，达到相同精度所需要的 epoch 数量越来越多。

LucyChen0228/DL-deeplearning-CV-computer-vision-traffic-signs-recognition-GTSRB-dataset

DL-deeplearning-CV-computer-vision-traffic-signs-recognition-GTSRB-dataset

Layer (type) Output Shape Param #

dense_2 (Dense) (None, 43) 1419