Readme
Issues
Stargazers
Watchers

Beyond SFT: Fine-grained Reward Model

EthanC111 opened this issue a year ago · 0 comments

EthanC111 commented a year ago

Relevant Papers:

https://arxiv.org/abs/2305.20050
https://arxiv.org/abs/2306.01693

Topics

generative-ai llm math

Share to

Contact site admin: Geeks.