TaciturnMute

reinforcement learning

Pinned Repositories

FinRL
硕士毕业设计~
Language:Python30
Psyduck
不要忘了我们的羁绊啊啊啊啊啊！（欢迎可达鸭爱好者来pull requests） :blush:
Language:Python0 1 01
rl-zoo
DRL基础模型实现。适合初学者入门或熟练者复习回顾~
Language:Python00
RLHF4Math
This repository contains sources about reinforcement learning human feedback for math reasoning,.
4 2 00

TaciturnMute's Repositories

TaciturnMute/RLHF4Math
This repository contains sources about reinforcement learning human feedback for math reasoning,.
4 2 00
TaciturnMute/FinRL
硕士毕业设计~
Language:Python30
TaciturnMute/Psyduck
不要忘了我们的羁绊啊啊啊啊啊！（欢迎可达鸭爱好者来pull requests） :blush:
Language:Python0 1 01
TaciturnMute/rl-zoo
DRL基础模型实现。适合初学者入门或熟练者复习回顾~
Language:Python00