HuiResearch/tfbert

单个epoch多个batch之间loss抖动过大

Opened this issue · 0 comments

使用作者代码训练数据,在模型收敛之后,loss抖动仍然很大,和其它代码相比则无此类问题(在英语训练语料上)