/finetuning

finetuning code

Primary LanguagePython

finetuning

finetuning code 对微调,奖励模型,强化学习进行大幅度的简化,代码复用 只是对bloom模型进行了测试 只是阶段性的修改 联系方式 dukeyuanshuai@gmail.com