exercise1

下方表格记录了本实验中不同学习率,不同优化器和不同batch_size设置下的效果对比。

学习率

此时优化器为Adam,batchisize为64,epoch为50

学习率 测试集准确率
0.001 77.48%
0.0005 79.52%
0.0001 74.16%

优化器

优化器 测试集准确率
SGD 75.62%
带动量的SGD 76.37%
Adam 79.52%
Adagrad 72.41%

batchsize

batchsize 测试集准确率
32 78.48%
64 79.52%