feyzaakyurek/rl4f

Code for RL4F: Generating Natural Language Feedback with Reinforcement Learning for Repairing Model Outputs. ACL 2023.

PythonMIT

Readme
3Issues
58Stargazers
3Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.