본 강화학습 스터디는 include 동아리 내에서 21년도 가을학기에 진행될 예정이며, 강화학습 전반에 관한 지식을 학습하고 이를 활용하는 것을 목표로 가진다.
매주 목요일 9시부터 약 1시간 진행
시험기간 2주전까지는 진행 안함
10-18(월) ~ 10-22(금) 중간고사
12-13(월) ~ 12-17(금) 기말고사
-
9/11
강화학습 이란?
기본적인 강화학습 개념
MDP, POMDP, 벨만방정식 ....
-
9/18
Value base model free 알고리즘
DQN, DDQN, PER, C51,Noisy, RAINBOW
-
9/25
policy base model free 알고리즘
REINFORCE, A3C, TRPO, PPO
-
10/2
policy base model free 알고리즘
Soft-Q, SAC
-
10/30
deterministic
DDPG, TD3
-
11/6
multi goal
UVFA, HER
-
12/29
exploration
ICM, RND
기본적으로 논문들을 한번씩 읽어보는것을 추천하고 인터넷이나 다른 방식으로 한번씩은 따로 공부하는 것을 추천한다.
중간고사를 마치고 기점 중 동아리 자체 RL 헤커톤을 열 예정
기본적인 RL 수준을 배우는것을 목표로 하고 조금더 높은 수준 또는 다양한 수준의 RL 쪽 내용은 다른 딥러닝 스터디를 통해 소개될 예정