[FEATURE REQUEST] Dynamic Rewarding with Prompt Optimization (DRPO)

Question

Opened this issue 2 days ago · 0 comments

I would like to suggestion:
Dynamic Rewarding with Prompt Optimization (DRPO):
https://arxiv.org/html/2411.08733v1#S1

Another approach to try

No response