charent/ChatLM-mini-Chinese

如何加载sft后的模型?

Liuxinhao12 opened this issue · 1 comments

我sft训练后发现model_save文件夹中多了一个sft文件夹,其中有checkpoints-10000还有一些其他的,如何加载并使用sft后的模型呢?

在推理阶段使用的话,修改config.py文件的这里:config.py#L15。如果当作为dpo阶段的模型使用,修改config.py文件的这里:config.py#L34

checkpoints-10000是检查点模型文件,方便你训练出现异常时回退到检查点,或者后面训练过拟合了就直接使用检查点的模型。直接保存到sft目录下的模型文件是训练完成后保存的。