运行chatglm的SFT代码,loss显示NAN
Closed this issue · 1 comments
woaipichuli commented
在chatglm2的预训练模型基础上跑模型代码,结果代码打印loss为NAN,从一开始loss就输出为NAN很奇怪
yongzhuo commented
这个是chatglm1,和2不一样
Closed this issue · 1 comments
在chatglm2的预训练模型基础上跑模型代码,结果代码打印loss为NAN,从一开始loss就输出为NAN很奇怪
这个是chatglm1,和2不一样