seal-wang opened this issue 8 months ago · 1 comments
是否考虑将预训练的模型和仅stf后的模型也上传的平台呢
暂无这个计划,从我这边针对下游任务微调的实验看,用dpo后的模型和仅预训练后的模型作为微调的基座模型效果差别不大。