/DS_lv3_2311_2

Primary LanguageJupyter Notebook

실습 내용

Day1 Day2 Day3
주제 최대수요전력 예측 스프링 내구력 테스트 통과/실패 예측 세탁 지수 예측
출제
영역
데이터 전처리
> Join, 표준화, 일자(date) 형식 처리, shifting
데이터 추출
> GroupBy, …
가설 검정
> Shapiro-Wilks, Bartlett, T,
일원산 분산분석, Mann-Whitney U
Chi2 독립성 검정, 이원산 분산분석
지도학습
> 결정트리, GBDT, SVM
비지도학습
> PCA, DBSCAN
이상치 탐색
> Isolation Forest, Local Outlier Factor
결측치 처리
> 반복적 결측치 처리
가설 검정
> 베르눌리 분포, 정규 분포
속성 선택
> 필터법, 전진선택법
가설 검정
> Jarque-bera, Bartlett, 일원산 분산분석
지도학습
> 로지스틱 회귀, 랜덤 포레스트, LDA
비지도학습
> PCA
하이퍼 파라미터 최적화
> 그리드 서치
데이터 전처리
> 치환, 문자열 결합, 표준화, 구간범주화, 가변수화
가설 검정
> Kolmogolov-Smironov, Bartlett, 일원산 분산분석
확률 통계
> 정규분포
지도학습
> Linear Regression, xgboost
비지도학습
> Agglomerative Clustering, PCA
하이퍼 파라미터 최적화

강의 시간표

구분 강의 내용 시작
0 전처리 8시 30분 9시 30분
1 문제 1 9시 40분 10시 40분
2 문제 2 10시 50분 11시 50분
3-1 문제 3 12시 00분 12시 30분
3-2 문제 3 13시 30분 14시 10분
4 문제4 14시 20분 15시 20분
5 문제5 15시 30분 16시 30분
6 문제6 16시 40분 17시 30분