StepNeverStop/RLs

值函数相关

StepNeverStop opened this issue · 0 comments

  • 通用的n-step值函数计算
  • TD($\lambda$)

以PPO为例,实现几种Trace计算方法:

  • Retrace
  • V-Trace