/22-1-Reinforcement-Learning

2022년 1학기 강화학습팀

Primary LanguageJupyter Notebook

22-1-Reinforcement Learning

2022년 1학기 강화학습팀

스터디원

  • 김승현
  • 김지수
  • 김진영
  • 박서영

스터디 공지사항

  • 시간 : 매주 화요일 6시~8시
  • 장소 : 자과/인사캠 따로 나뉘어 미팅
  • 온라인/ 오프라인 : 추후 결정
  • 스터디 방식 : 각 주차마다 해당하는 cs234 강의를 듣고, 각자 질문을 4개 정도씩 준비해서 Notion 해당 주차에 업로드합니다. 스터디 시간 동안은 서로 만들어온 질문에 대해 답하고 토론하는 시간을 가집니다.
  • 학기 말 프로젝트 코드는 각자 깃허브에 업로드합니다.

스터디 노션

https://www.notion.so/1c1b29cae68c42d7b12b80315cf2a37c

커리큘럼

  • 강의는 스탠포드 대학의 19년 겨울학기 cs234 수업으로 진행합니다. (총 15강)
  • 일정은 함께 상의 후 추가/변경될 수 있습니다.
  • 스터디는 총 9회차로 계획되어 있으며, 앞의 6회차는 강의 수강, 뒤의 3회차는 프로젝트를 진행합니다.
  • 강의 수강 외에도 구글링과 논문 리서치, 모델 구현 등 자발적인 참여는 환영입니다!
주차 날짜 내용 비고
OT 2022년 3월 1일
1주차 2022년 3월 8일 cs234 1강. Introduction
cs234 2강. Given a model of the world
cs234 3강. Model-Free Policy Evaluation
2주차 2022년 3월 15일 cs234 4강. Model-Free Control
cs234 5강. Value-Function Approximation
3주차 2022년 3월 22일 cs234 6강. CNNs and Deep-Q Learning
cs234 7강. Imitation Learning
4주차 2022년 3월 29일 cs234 8강. Policy Gradient 1
cs234 9강. Policy Gradient 2
cs234 10강. Policy Gradient 3 & review
중간고사 휴회
중간고사 휴회
5주차 2022년 4월 19일 cs234 11강. Fast Reinforcement Learning 1
cs234 12강. Fast Reinforcement Learning 2
cs234 13강. Fast Reinforcement Learning 3
6주차 2022년 4월 26일 cs234 15강. Batch Reinforcement Learning
cs234 16강. Monte-Carlo Tree Search
7주차 2022년 5월 3일 프로젝트 1
8주차 2022년 5월 10일 프로젝트 2
9주차 2022년 5월 17일 프로젝트 3
기말고사 휴회
기말고사 휴회
성과공유회