DRL_RobotSLR 6/26 更新:增加了动态环境 存在的问题: *可能缺少某些躲避行为的及时反馈机制 *随机环境容易导致快速失败,无法正确地向智能体反馈错误行为,应该保证随机环境的前若干步是安全的 *尝试参考robotschool的奖励机制设定