공공데이터를 활용한 데이터 분석 방법을 이해하고, 데이터 획득 방법, 전처리, 시각화 실습을 진행하여 실제 데이터를 활용 및 이해하는 방법을 익히고자 한다
- 1주차: 공공데이터 분석의 개요
- 2주차: 공공데이터를 활용한 데이터 전처리(1)
- 결측치 처리, 이상치 처리, 중복데이터 처리, 데이터 통합(concat, merge), 집계데이터(groupby)
- CODE
- 3주차: 공공데이터를 활용한 데이터 전처리(2)
- 집계 데이터(crosstab, groupby), 이산화(qcut) 스케일변환(z-score, min-max), 원핫인코딩
- CODE
- 4주차: 공공데이터를 활용한 데이터 시각화(1)
- seaborn, matplotlib을 활용한 데이터 시각화
- CODE
- 5주차: 공공데이터를 활용한 데이터 시각화(2)
- plotly를 활용한 데이터 시각화
- CODE
- 6주차: 공공데이터를 활용한 데이터 시각화(3)
- 지도 시각화(plotly, folium)
- CODE
- 7주차: 공공데이터를 활용한 탐색적 데이터 분석
- 서울 지하철 데이터 탐색적 분석
- CODE
- 9주차: 공공데이터를 활용한 수치형 데이터 분석(1)
- 분류 알고리즘(DecisionTreeClassifier, SVC)
- CODE
- 10주차: 공공데이터를 활용한 수치형 데이터 분석(2)
- 앙상블 모델(RandomForestClassifier, XGBClassifier, VotingClassifier), 하이퍼파라미터 튜닝(GridSearchCV)
- CODE
- 11주차: 공공데이터를 활용한 텍스트 데이터 분석(1)
- 12주차: 공공데이터를 활용한 텍스트 데이터 분석(2)
- 13주차: 공공데이터를 활용한 시계열 데이터 분석(1)
- 선형회귀모델, DeterministicProcess, 트렌드(trend)
- CODE
- 14주차: 공공데이터를 활용한 시계열 데이터 분석(2)