训练reward model的脚本

Question

wangzhao88 opened this issue a year ago · 3 comments

您好：
请问可以支持对齐技术报告的reward model的训练模块吗？我想复现一下文中reward model的效果，谢谢。

Answer 1 · 2023-07-20T09:55:30.000Z

感谢您对本项目的关注～因为奖励模型的训练涉及一些提高奖励模型表现的方法，所以我们暂时还不能对奖励模型进行开源。我们预计会在8-9月分的PART II部分放出后，对奖励模型的训练进行开源，感谢您的关注和认可～

Answer 2 · 2023-11-01T01:36:06.000Z

这个issue是否还有后续？

Answer 3 · 2023-11-14T12:24:42.000Z

您好，Reward model 训练部分还会开源吗？