/2020-Data-Youth-Campus

2020 데이터 청년 캠퍼스 [연세대학교-빅데이터 분석처리 과정]

Primary LanguageJupyter Notebook

🐳 2020 데이터 청년 캠퍼스

연세대학교 - 빅데이터 분석처리 과정

🐳 1. 개요

  • 공모전: 2020 데이터 청년 캠퍼스 프로젝트

  • 주제: 교통정보 활용 미래 교통상황 예측 모델 개발

  • 수행기간: 2020. 07. 13 ~ 2020. 09. 08

  • 수행인원: 양재영, 김윤환, 정규형, 이하경

  • 담당역할: VDS 설치 정보 데이터 수집, 경부선 데이터 탐색 및 이상치 처리

  • 분석도구: Python, QGIS, Excel, R

🐳 2. 분석 내용

  • QGIS를 통해 고속도로 위에 있지 않은 '가상 VDS' 관측치 제거

  • EDA를 통해 평균속도가 140 이상인 관측치를 이상치로 판단

  • 이상치를 기록한 VDS 장치를 찾은 후, 이상치 관측치들을 각 VDS 장치에서 기록한 관측치들의 중앙값으로 대체

  • 경부고속도로 주행속도 예측을 위해 통계적 기법인 ARIMA와 딥러닝 LSTM 두 모델을 적용, 예측력이 우수한 LSTM 모델을 최종 모델로 채택