yalecyu/crnn.caffe

CNN结构替换成denseNet时遇到的问题

TongYoungG opened this issue · 0 comments

您好,谢谢您的无私分享。我将crnn中的cnn结构替换成densenet结构时,遇到了一些问题。

  1. solver文件设置test_initialization: true,TEST阶段的ctcloss=nan,accuarcy=0,一直到训练结束。
    我打印训练日志看了下,TEST阶段连个LSTM层的输出均为nan,且bn层的参数值也不正常。
    image

  2. 设置test_initialization: false时,1的问题就解决了,但是在模型训练好之后,利用模型对测试集进行评估时,准确率在45%左右;实际训练中训练集准确率=1, 验证集准确率为98%;我又用模型对验证集的准确率进行了统计,准确率也在55%左右。

这个问题一直困扰我很久,如果你也碰到了类似问题,请问有没有什么解决办法