kwai/DouZero

能否分享一下sl训练的代码? 不需要分享人类的训练数据!

Opened this issue · 1 comments

用人类数据训练没思路, 哪位大佬可以指点一下?? 感谢

有显卡吗

我不用显卡训练, 用cpu训练,目前训练出来的模型有时候不符合人类的出牌习惯, 不知怎样用人类数据去训练