2022년 1학기 강화학습팀
- 김승현
- 김지수
- 김진영
- 박서영
- 시간 : 매주 화요일 6시~8시
- 장소 : 자과/인사캠 따로 나뉘어 미팅
- 온라인/ 오프라인 : 추후 결정
- 스터디 방식 : 각 주차마다 해당하는 cs234 강의를 듣고, 각자 질문을 4개 정도씩 준비해서 Notion 해당 주차에 업로드합니다. 스터디 시간 동안은 서로 만들어온 질문에 대해 답하고 토론하는 시간을 가집니다.
- 학기 말 프로젝트 코드는 각자 깃허브에 업로드합니다.
https://www.notion.so/1c1b29cae68c42d7b12b80315cf2a37c
- 강의는 스탠포드 대학의 19년 겨울학기 cs234 수업으로 진행합니다. (총 15강)
- 일정은 함께 상의 후 추가/변경될 수 있습니다.
- 스터디는 총 9회차로 계획되어 있으며, 앞의 6회차는 강의 수강, 뒤의 3회차는 프로젝트를 진행합니다.
- 강의 수강 외에도 구글링과 논문 리서치, 모델 구현 등 자발적인 참여는 환영입니다!
주차 | 날짜 | 내용 | 비고 |
---|---|---|---|
OT | 2022년 3월 1일 | ||
1주차 | 2022년 3월 8일 | cs234 1강. Introduction cs234 2강. Given a model of the world cs234 3강. Model-Free Policy Evaluation |
|
2주차 | 2022년 3월 15일 | cs234 4강. Model-Free Control cs234 5강. Value-Function Approximation |
|
3주차 | 2022년 3월 22일 | cs234 6강. CNNs and Deep-Q Learning cs234 7강. Imitation Learning |
|
4주차 | 2022년 3월 29일 | cs234 8강. Policy Gradient 1 cs234 9강. Policy Gradient 2 cs234 10강. Policy Gradient 3 & review |
|
중간고사 휴회 | |||
중간고사 휴회 | |||
5주차 | 2022년 4월 19일 | cs234 11강. Fast Reinforcement Learning 1 cs234 12강. Fast Reinforcement Learning 2 cs234 13강. Fast Reinforcement Learning 3 |
|
6주차 | 2022년 4월 26일 | cs234 15강. Batch Reinforcement Learning cs234 16강. Monte-Carlo Tree Search |
|
7주차 | 2022년 5월 3일 | 프로젝트 1 | |
8주차 | 2022년 5월 10일 | 프로젝트 2 | |
9주차 | 2022년 5월 17일 | 프로젝트 3 | |
기말고사 휴회 | |||
기말고사 휴회 | |||
성과공유회 |