강화학습 Include 스터디

본 강화학습 스터디는 include 동아리 내에서 21년도 가을학기에 진행될 예정이며, 강화학습 전반에 관한 지식을 학습하고 이를 활용하는 것을 목표로 가진다.

일정

매주 목요일 9시부터 약 1시간 진행

시험기간 2주전까지는 진행 안함

10-18(월) ~ 10-22(금) 중간고사

12-13(월) ~ 12-17(금) 기말고사

  • 9/11

    강화학습 이란?

    기본적인 강화학습 개념

    MDP, POMDP, 벨만방정식 ....

  • 9/18

    Value base model free 알고리즘

    DQN, DDQN, PER, C51,Noisy, RAINBOW

  • 9/25

    policy base model free 알고리즘

    REINFORCE, A3C, TRPO, PPO

  • 10/2

    policy base model free 알고리즘

    Soft-Q, SAC

  • 10/30

    deterministic

    DDPG, TD3

  • 11/6

    multi goal

    UVFA, HER

  • 12/29

    exploration

    ICM, RND

참고사항

기본적으로 논문들을 한번씩 읽어보는것을 추천하고 인터넷이나 다른 방식으로 한번씩은 따로 공부하는 것을 추천한다.

중간고사를 마치고 기점 중 동아리 자체 RL 헤커톤을 열 예정

기본적인 RL 수준을 배우는것을 목표로 하고 조금더 높은 수준 또는 다양한 수준의 RL 쪽 내용은 다른 딥러닝 스터디를 통해 소개될 예정