/SillimTasteRoad

크롤링을 통해 데이터를 수집하고, 파이썬으로 분석해서 신림역 주변 진짜 맛집을 찾아보자!

Primary LanguageJupyter Notebook

신림역 근처 음식점 찾기

프로젝트 결과물


프로젝트 설명

프로젝트 목적

  • 신림역에서 쉽게 맛집을 찾기 위해 시작
    • 어디가 맛집이지? 이 근처에 뭐 있지? 라는 고민을 해결해주기 위한 프로젝트

데이터 수집 및 전처리

크롤링

  • 카카오맵에서 신림역 음식점 510곳 크롤링
    • Selenium, BeautifulSoup 사용

데이터 전처리

  • str to numeric
  • 결측값 처리
  • 특성 추가
    • 위도, 경도
    • 신림역에서 거리
  • JMS 지표 계산
    • 맛집 지표를 나타내줄 지표 선정 (JMS, John Mat Score)
    • 수식: $$JMS = score * log(eval_cnt) + log(review_cnt)$$

분석

  • 분석 데이터 필터링
  • JMS의 분포 확인
  • 리뷰 정성적 분석, WordCloud기법 활용
  • 리뷰 비교/분석
  • 연도별 평점 변화 확인
    • 시계열 데이터를 통해 리뷰의 증감 변화 확인
  • 최근 3년간 평균 평점, 평가 수 확인
  • 최근 3년 평점 수 변화 모니터링