dbcSep03 opened this issue 9 months ago · 1 comments
使用huggingface实现的sft_train.py 中有实现对应的embeeding和encoder冻结么?
这个没有,不过你可以从本项目实现的trainer把冻结网络部分的代码复制到sft_train.py中加载模型完成的代码后面。
sft_train.py
layers_to_freeze = [model.shared, model.encoder] for layer in layers_to_freeze: for param in layer.parameters(): param.requires_grad = False