Desny/traffic_light_rl

help

Closed this issue · 3 comments

您好,请问您的状态、动作和奖励具体是怎么定义的啊,我看代码的时候没太能理解,所以来请教您,希望您能解答,十分感谢!

以及有使用到target network嘛?我看main.py中有定义一个target,没太能理解是不是target network的意思
image

Desny commented

您好,请问您的状态、动作和奖励具体是怎么定义的啊,我看代码的时候没太能理解,所以来请教您,希望您能解答,十分感谢!

状态:道路密度(道路目前的车辆数/道路上满车辆数),动作(信号灯相位),奖励(我用的奖励函数比较简单,就是判断我选择的信号灯相位是否疏通了等待时间最长的道路,是->+1,否->-1)

Desny commented

以及有使用到target network嘛?我看main.py中有定义一个target,没太能理解是不是target network的意思 image

是target_network,也用到了target_network