charent/ChatLM-mini-Chinese

是否考虑将预训练的模型和仅stf后的模型也上传的平台呢

seal-wang opened this issue · 1 comments

是否考虑将预训练的模型和仅stf后的模型也上传的平台呢

暂无这个计划,从我这边针对下游任务微调的实验看,用dpo后的模型和仅预训练后的模型作为微调的基座模型效果差别不大。