AnMoran opened this issue 5 years ago · 0 comments
我用8个bn+sc+relu+conv+concat取代了denseblock层,训练学习率设置为0.00001,每个step衰减为原来一半,loss在20多的时候就不收敛了,请问超参数设置有什么技巧吗?