loss不收敛

Question

AnMoran opened this issue 5 years ago · 0 comments

我用8个bn+sc+relu+conv+concat取代了denseblock层，训练学习率设置为0.00001，每个step衰减为原来一半，loss在20多的时候就不收敛了，请问超参数设置有什么技巧吗？