/public_data_analysis

공공데이터 분석과 시각화 코드 및 데이터 저장소

Primary LanguageJupyter Notebook

공공데이터 분석과 시각화

목표

공공데이터를 활용한 데이터 분석 방법을 이해하고, 데이터 획득 방법, 전처리, 시각화 실습을 진행하여 실제 데이터를 활용 및 이해하는 방법을 익히고자 한다

커리큘럼

  • 1주차: 공공데이터 분석의 개요
  • 2주차: 공공데이터를 활용한 데이터 전처리(1)
    • 결측치 처리, 이상치 처리, 중복데이터 처리, 데이터 통합(concat, merge), 집계데이터(groupby)
    • CODE
  • 3주차: 공공데이터를 활용한 데이터 전처리(2)
    • 집계 데이터(crosstab, groupby), 이산화(qcut) 스케일변환(z-score, min-max), 원핫인코딩
    • CODE
  • 4주차: 공공데이터를 활용한 데이터 시각화(1)
    • seaborn, matplotlib을 활용한 데이터 시각화
    • CODE
  • 5주차: 공공데이터를 활용한 데이터 시각화(2)
    • plotly를 활용한 데이터 시각화
    • CODE
  • 6주차: 공공데이터를 활용한 데이터 시각화(3)
    • 지도 시각화(plotly, folium)
    • CODE
  • 7주차: 공공데이터를 활용한 탐색적 데이터 분석
    • 서울 지하철 데이터 탐색적 분석
    • CODE
  • 9주차: 공공데이터를 활용한 수치형 데이터 분석(1)
    • 분류 알고리즘(DecisionTreeClassifier, SVC)
    • CODE
  • 10주차: 공공데이터를 활용한 수치형 데이터 분석(2)
    • 앙상블 모델(RandomForestClassifier, XGBClassifier, VotingClassifier), 하이퍼파라미터 튜닝(GridSearchCV)
    • CODE
  • 11주차: 공공데이터를 활용한 텍스트 데이터 분석(1)
  • 12주차: 공공데이터를 활용한 텍스트 데이터 분석(2)
  • 13주차: 공공데이터를 활용한 시계열 데이터 분석(1)
    • 선형회귀모델, DeterministicProcess, 트렌드(trend)
    • CODE
  • 14주차: 공공데이터를 활용한 시계열 데이터 분석(2)
    • 계절성(seasonality), 주기(cycle), 하이브리드 시계열 예측 모델
    • CODE1, CODE2