Minsoo0405/wanted-pre-onboarding-challenge-data

공공자전거 대여이력 데이터 전처리하기

Closed this issue · 2 comments

공공자전거 대여이력 데이터 전처리하기

목적

공공자전거 대여이력 데이터가 json 형태이므로 데이터프레임으로 변환하여 전처리한다.

작업 상세 내용

  • 먼저 2018년 1월 json 파일로 읽고, 데이터프레임으로 변환
  • "Date", "Hour", "Rented Bike Count" 컬럼 생성하여 데이터프레임으로 저장
  • 전체 파일을 전처리 과정을 실행하는 함수를 정의

참고사항

  • json 파일 구조 확인하기
  • 필요한 전처리 과정을 한번씩 해보기

작업 결과

json 파일 구조를 알게 되었음.
2018년 1월 데이터로 전처리 진행 중.

이후 필요한 작업

  • "Date", "Hour", "Rented Bike Count" 컬럼 생성하여 데이터프레임으로 저장
  • 전체 파일을 전처리 과정을 실행하는 함수를 정의

작업 결과

대여이력정보 json 파일에서 필요한 컬럼만 골라 데이터프레임 형태로 변환후, csv 파일로 저장
위 내용을 간략히 함수형태로 만들어 변수 입력만으로 실행되도록 만듬

이후 필요한 작업

  • "Date", "Hour", "Rented Bike Count" 컬럼 생성하여 데이터프레임으로 저장
  • 전체 파일을 전처리 과정을 실행하는 함수를 정의