수학으로 풀어보는 강화학습 원리와 알고리즘 예제(TF2.0 버전)

"수학으로 풀어보는 강화학습 원리와 알고리즘" 이라는 책의 예제(텐서플로2.0) 입니다. 저자분의 github(https://github.com/pasus/Reinforcement-Learning-Book) 를 참고하여 만들었습니다. 책 자체의 내용과 예제는 매우 잘 만들어져 있습니다. 하지만 다소 오래전에 집필된 탓에 예제가 tf1.x대 버전인 것이 개인적으로 아쉬웠습니다. 다른 독자분들을 위해 DRL 예제들을 TF2.0에서 구동되도록 포팅해 보았습니다. 저자께서 작성한 코드의 구조를 최대한 보존하며 작성하려 노력한 코드입니다. 이 코드가 "수학으로 풀어보는 강화학습 원리와 알고리즘"을 학습하는 데에 조금이라도 도움이 더 되었으면 합니다. 감사합니다.