/ReinforcementLearningAtoZ

The official code repository of Fastcampus <Reinforcement Learning A-Z> (패스트 캠퍼스 강화학습 A-Z)

Primary LanguageJupyter Notebook

패스트 캠퍼스 강화학습 A-Z (Reinforcement Learning A-Z)

The official code repository of 패스트캠퍼스 강화학습 A-Z

Git 사용이 익숙하지 않으신 분들을 위하여!

Git사용에 익숙하지 않으신 분들은 우측 상단에 있는 [clone] 버튼을 누르신 후, Download zip 으로 코드를 다운로드 받으셔도 됩니다 :)

공지사항

2020.06.29: <파트2. 가치기반 강화학습> 에 해당하는 코드 구현완료.
2020.07.03: <파트3. 함수 근사기법> 에 해당하는 코드 구현완료.
2020.07.03: <파트4. 정책 최적화> 에 해당하는 코드 구현완료.
2020.07.17: <파트5. 심층 강화학습> 에 해당하는 코드 구현완료.
2020.07.31: <파트6. 모델기반 강화학습> 에 해당하는 코드 구현완료 / 필요한 라이브러리 업데이트

필요한 라이브러리

numpy, gym, pandas, pytorch, matplotlib, scipy, jupyter

추가적으로 로깅을 위해서 wandb를 사용합니다.
<파트 6. 모델기반 강화학습> 실습코드는 pytorch 1.5를 필요로 합니다.

Repository 구성

연습코드

excercise 여러분들이 직접 강화학습 코드를 구현해보세요!

실습코드

PART2 <파트2. 가치기반 강화학습> 실습코드
PART3 <파트3. 함수근사 기법> 실습코드
PART4 <파트4. 정책 최적화> 실습코드
PART5 <파트5. 심층 강화학습> 실습코드
PART6 <파트6. 모델 기반 강화학습> 실습코드

기타

lecture_material 수업에 사용된 이미지를 생성하는 코드 / 노트북