yongzhuo/LLM-SFT

运行chatglm的SFT代码,loss显示NAN

Closed this issue · 1 comments

在chatglm2的预训练模型基础上跑模型代码,结果代码打印loss为NAN,从一开始loss就输出为NAN很奇怪

这个是chatglm1,和2不一样