danbi5228/Project_pregnant_seat_subway

Jupyter Notebook

Project_pregnant_seat_subway

자유롭게 갖고 놀기 위한 가이드

0. 이 레포지토리를 fork 합니다.

1. 내 로컬 어딘가 적당히 clone을 합니다.

2. clone 된 폴더로 들어가 터미널을 열고 branch를 땁니다.

브랜치 이름은 sdt-이름숫자로 만들어주시면 될 것 같습니다. 예를들어 이름이 bomin이라면 sdt-bomin1 브랜치를 생성하면 됩니다. 숫자는 한번 풀리퀘스트를 보내고 머지가 될 때 마다 올라갑니다. sdt는 small data test의 약자 입니다.

3. branch로 checkout 한 후 폴더에서 jupyter notebook을 실행시킵니다.

4. 자유롭게 파일을 만들어보거나 추가하거나 원래 있던 파일을 가지고 놀아보면 됩니다.

5. 스몰데이터 셋을 DATA 폴더에 업데이트 할 때는 파일 이름을 `다운로드받은날짜-이름`로 해주시면 될 것 같습니다.

같은날 받은 csv가 data 셋에 중복되게 들어올 경우도 있을 것 같으니 0813-이름으로 하겠습니다.

0813-bomin.csv 전처리 과정

드라이브에서 excel 파일로 다운로드를 받습니다,
첫행을 delete합니다.(컬럼의 대분류는 사람이 보기 좋으라고 만든거니까 굳이 필요 없을거라고 생각했습니다.)
오른쪽에 달아놓은 주석(연령, 붐빔정도 등등에 대한 설명)도 delete합니다.
pandas로 가공하기에 날짜는 엑셀에서 미리 날짜형식으로 바꾸는 것이 편해서 날짜 형식으로 바꾸었고, 시간은 그대로 string으로 두었습니다.
저장형식을 csv 문서로 하고 파일 이름은 데이터를 다운받은 날짜로 바꿔줍니다.

csv를 다운받아서 excel에서 가공하는 것 부터 마음대로 한 번 해보시면 좋을 것 같습니다.

pullrequest는 아무때나 아무렇게나 날려주시면 확인하고 반영할게요!