AlexNet 为什么 loss 不收敛? (1)数据没打乱,一个batch是同一类别数据; (2)学习率过大; (3)batch过大(不知道为什么会影响loss收敛); (4)优化器的选择(SGD --> Adam) Reference: https://blog.csdn.net/qq_33254870/article/details/90705034