StepNeverStop/RLs

设置无论on-policy还是off-policy其数据类型均为至少2维,即[batchsize, dimension]

Closed this issue · 1 comments

设置无论on-policy还是off-policy其数据类型均为至少2维,即[batchsize, dimension]
  • 检查存入经验池的数据类型
  • 考虑是否撰写经验池自动检测并自动升维和降维的功能