Langboat/Mengzi

请问预训练的schedule是怎么设置的

NinedayWang opened this issue · 1 comments

请问训练base和large模型时,学习率和warmup等分别是怎么设置的?