- 브랜치 이름은
sdt-이름숫자
로 만들어주시면 될 것 같습니다. 예를들어 이름이bomin
이라면sdt-bomin1
브랜치를 생성하면 됩니다. 숫자는 한번 풀리퀘스트를 보내고 머지가 될 때 마다 올라갑니다. sdt는 small data test의 약자 입니다.
- 같은날 받은 csv가 data 셋에 중복되게 들어올 경우도 있을 것 같으니
0813-이름
으로 하겠습니다.
- 드라이브에서 excel 파일로 다운로드를 받습니다,
- 첫행을 delete합니다.(컬럼의 대분류는 사람이 보기 좋으라고 만든거니까 굳이 필요 없을거라고 생각했습니다.)
- 오른쪽에 달아놓은 주석(연령, 붐빔정도 등등에 대한 설명)도 delete합니다.
- pandas로 가공하기에 날짜는 엑셀에서 미리 날짜형식으로 바꾸는 것이 편해서 날짜 형식으로 바꾸었고, 시간은 그대로 string으로 두었습니다.
- 저장형식을 csv 문서로 하고 파일 이름은 데이터를 다운받은 날짜로 바꿔줍니다.
csv를 다운받아서 excel에서 가공하는 것 부터 마음대로 한 번 해보시면 좋을 것 같습니다.
pullrequest는 아무때나 아무렇게나 날려주시면 확인하고 반영할게요!