/Login_project

더조은 3조 비즈니스 인사이트 로그데이터 분석

Primary LanguageJupyter Notebook

3조 Log人, 팀 프로젝트1

* 주제
        - 로그데이터 분석을 통한 '숙박업 비지니스 창출' 지원용 인사이트 생산 및 표출

* 상세내용
        - 관광 및 교통 로그 데이터를 수집
        - 로그데이터 외 추가적으로 숙박업 후기 정보(웹크롤링)를 로그데이터와 결합
        - 통계 및 기계학습? 분석을 통해 '숙박업 비지니스 창출' 관련 인사이트 도출
        - 프로젝트 소개 페이지 및 인사이트 표출(개발코드 및 분석그림) 웹 페이지 개발

* 역할분담 (상시 업데이트)
        - 분석기획: 전 인원
        - 웹크롤링: 김만기(네이버 지도), 신호철(야놀자 호텔), 김성진(야놀자 모텔)
        - DB 구축: 김만기
        - 데이터분석: 정지용, 이가연, 신호철, 김성진, 김만기
        - 웹개발: 김성동

* 진행기획 (`23.05.03 ~ 05.26)
        1. 웹크롤링으로 숙박업소 리뷰, 가격등 경쟁자들을 분석하고 비지니스 전략 수립
        2. 웹크롤링은 최대 19일까지 마치고 마지막주에는 데이터분석 및 웹개발, 발표물 제작등을 지원
        3. 최종적으로 분석한 결과물을 웹에 구현하여 사용자들이 결과물을 보고 사용할수있도록 함 
        4. 22일부터 전원이 각자 맡은 부분의 파워포인트 발표물을 함께 제작

* 분석 및 개발 내용
        - 공공 데이터 수집 (김성동, 정지용) 
                - 공공데이터 포털을 이용해 '교통 및 관광 로그' 데이터 수집
        - 웹 크롤링
                - 네이버 지도 (김만기)
                        - 서울시 숙박업 인허가 정보리스트 수집 (6664개 업소 정보 포함)
                        - 업소 리스트를 네이버지도에서 검색후 숙박업 정보(별점, 후기 등) 수집
                - 야놀자 (신호철, 김성진)
                        - 야놀자 홈페이지에서 서울의 '모텔/호텔' 숙박업 정보(별점, 후기 등) 수집
        - DB 구축 (김만기)
                - AWS 서버에 PostgreSQL 설치(완료, 김경훈님 도움)
                - 숙박, 교통, 관광 데이터 전처리 및 db 추가
                - db 모델링
        - 데이터 분석
                - 관광지, 관광객 특징 분석 (정지용)
                        - (방법) 관광객 로그 데이터의 통계 분석 및 특징 시각화
                        - (내용1) 관광객 지출, 방문, 검색 데이터 분석, 시각화
                        - (내용2) 관광객 검색과 방문 간의 상관관계 분석
                - 숙박업소 속성과 관광지 관련성 분석(이가연, 정지용)
                        - (방법) 관광객 로그 데이터와 교통,숙박업소 정보 결합 및 군집 분석
                        - (내용1) 숙박업체 - (교통) - 관광지 데이터간 연결링크 개발 작업 (이가연)
                                - 숙박업소 데이터에 주변 교통편, 관광지 속성 삽입
                        - (내용2) 관광지, 교통, 호텔위치 정보를 이용한 군집분석 (정지용)
                        - (내용3) 관광객이 중요시하는 주변 숙박업소 속성 분석(검색 기록로그 사용) (김만기)
                - 크롤링 데이터(숙박업소 후기정보) 분석
                        - (방법) 워드클라우드, 통계분석
                        - (내용1) 야놀자 인기태그 및 별점별 후기 워드클라우드 (김성진)
                        - (내용2) 야놀자 호텔 유형별 속성 통계 분석 (신호철)
                        - (내용3) 네이버 지도의 "이런점이 좋아요" 워드클라우드, 빈도분석 (김만기)
                        - (내용4) 네이버 지도의 별점별 "이럼점이 좋아요" 통계적 차이분석 (김만기)
        - 웹 개발
                - 프로젝트 수행내용 웹 표출을 위한 웹 페이지 개발 (김성동)
                - 웹페이지 구성요소 설정
                - 홈, 프로젝트 소개, 프로젝트 코드 및 시각화 구축 코드 작성
        
* 데이터 정보
        - 교통 정보
                - 역별 시간대별 버스 승하차 정보 - http://data.seoul.go.kr/dataList/OA-12913/S/1/datasetView.do
                - 지하철 호선별 시간대별 승하차 - http://data.seoul.go.kr/dataList/OA-12921/F/1/datasetView.do
                - 지하철 위치정보 - https://www.data.go.kr/data/15099316/fileData.do?recommendDataYn=Y
                - 서울시 역사마스터 정보 - https://data.seoul.go.kr/dataList/OA-21232/S/1/datasetView.do
        - 숙박업 관련정보 (크롤링)
                - 서울시 숙박업 인허가 정보리스트 수집 - https://data.seoul.go.kr/dataList/OA-16044/S/1/datasetView.do
                - 네이버 지도 - https://map.naver.com/v5)
                - 야놀자 홈페이지 - https://www.yanolja.com/)
        - 관광 정보
                - 한국관광 데이터랩 - https://datalab.visitkorea.or.kr/datalab/portal/main/getMainForm.do
                        - 지역별 방문자수 - https://datalab.visitkorea.or.kr/datalab/portal/bda/getMetcoAna.do
                        - 지역별 지출액 - https://datalab.visitkorea.or.kr/datalab/portal/bda/getByLocgoCnsmAmt.do
                        - 지역별 검색건수 - https://datalab.visitkorea.or.kr/datalab/portal/bda/getDomInqCnt.do
                        - 지역별 유입,유출 방문객 - https://datalab.visitkorea.or.kr/datalab/portal/loc/getAreaDataForm.do# 
                        - 관광지 목록(위치) - https://datalab.visitkorea.or.kr/datalab/portal/loc/getTourLocalDataForm.do
         - 호텔매출 관련 정보
                - 통계청 https://kostat.go.kr/ansk/     
                        검색어: 호텔매출