22-1-Reinforcement Learning

2022년 1학기 강화학습팀

스터디원

시간 : 매주 화요일 6시~8시
장소 : 자과/인사캠 따로 나뉘어 미팅
온라인/ 오프라인 : 추후 결정
스터디 방식 : 각 주차마다 해당하는 cs234 강의를 듣고, 각자 질문을 4개 정도씩 준비해서 Notion 해당 주차에 업로드합니다. 스터디 시간 동안은 서로 만들어온 질문에 대해 답하고 토론하는 시간을 가집니다.
학기 말 프로젝트 코드는 각자 깃허브에 업로드합니다.

주차	날짜	내용
OT	2022년 3월 1일
1주차	2022년 3월 8일	cs234 1강. Introduction cs234 2강. Given a model of the world cs234 3강. Model-Free Policy Evaluation
2주차	2022년 3월 15일	cs234 4강. Model-Free Control cs234 5강. Value-Function Approximation
3주차	2022년 3월 22일	cs234 6강. CNNs and Deep-Q Learning cs234 7강. Imitation Learning
4주차	2022년 3월 29일	cs234 8강. Policy Gradient 1 cs234 9강. Policy Gradient 2 cs234 10강. Policy Gradient 3 & review
	중간고사 휴회
	중간고사 휴회
5주차	2022년 4월 19일	cs234 11강. Fast Reinforcement Learning 1 cs234 12강. Fast Reinforcement Learning 2 cs234 13강. Fast Reinforcement Learning 3
6주차	2022년 4월 26일	cs234 15강. Batch Reinforcement Learning cs234 16강. Monte-Carlo Tree Search
7주차	2022년 5월 3일	프로젝트 1
8주차	2022년 5월 10일	프로젝트 2
9주차	2022년 5월 17일	프로젝트 3
	기말고사 휴회
	기말고사 휴회
	성과공유회