OpenLMLab/LOMO

CLIP梯度和梯度overflow的影响

tzjtatata opened this issue · 2 comments

你好,非常感谢你们的出色工作。
我有两个疑惑:对于LomoTrainer中额外使用的这两个东西是否非常重要?对性能的影响有多大呢?

你好,
这两个参数在使用较大的学习率时比较重要,可以调整梯度的大小避免loss跑飞或者出现nan,