charent/ChatLM-mini-Chinese

sft_train

dbcSep03 opened this issue · 1 comments

使用huggingface实现的sft_train.py 中有实现对应的embeeding和encoder冻结么?

这个没有,不过你可以从本项目实现的trainer把冻结网络部分的代码复制到sft_train.py中加载模型完成的代码后面。

layers_to_freeze = [model.shared, model.encoder]
for layer in layers_to_freeze:
     for param in layer.parameters():
        param.requires_grad = False