StepNeverStop/RLs

通用的经验表示格式,结合经验池机制优化数据流

Opened this issue · 1 comments

通用的经验表示格式,结合经验池机制优化数据流
  • 适配gym
  • 测试LSTM是否正确开启训练
  • 修复On-policy算法