LEM0NTE opened this issue 2 years ago · 1 comments
我在训练过程中发现这样的信息,我不确定这是否对模型的训练有影响。此外,我在Uniformer的基础上调整了部分结构,也会有新的模块显示may be unused,并且会出现NaN loss。所以我想知道这些警告的原因以及如何解决
这些是jit_analysis的warning,没有影响的。训练NaN的话,在transformer-based的model比较常见,最简单的方案是关闭混合精度训练,但需要显存翻倍。此外,可以适当调小学习率、数据增强等等。