seungeunrho/minimalRL

Missing done mask?

Junyoungpark opened this issue · 3 comments

혹시 critic target에서 done mask를 곱해주는것을 빼먹으신거 아닌가요?

target = r + gamma * q_target(s_prime, mu_target(s_prime))

준영님 안녕하세요, 잘 지내시죠!?
감사합니다 다소늦었지만.. 처리하였습니다!!