Tobigs 추천 컨퍼런스 Phase 2

Trip Advisor 데이터 분석 및 CF 기반 모델링

Dashboard

담당자	분류	설명	해당 파일
SY	EDA	Trip Advisor 데이터의 간단한 EDA	링크
YN	Model	FM 모델	링크
YN	Model	SVD 모델	링크
YN	Model	Neural Collaborative Filtering 모델	링크
YN	Model	Simple Algoritm Recommender 모델	링크
YN	Model	Wide and Deep 모델	링크
YN	Model	Wide and Deep all 모델	링크
YN	Model	deepFM 모델	링크
YN	Model	AFM 모델	링크
JB	Model	SAR 모델	링크
JB	Model	SAR 모델	링크
HJ	Model	autoencoder_collaborate_filtering 모델	링크
HJ	Model	VAE CF 모델	링크

경로 접근시 통일성을 위해 반드시 os.path.join("..","..","data","data.json") 와 같은 path join을 사용한다.
절대 pd.read_csv("C://tobigs//data") 이런 코드가 있어선 안된다.

import pandas as pd 
import os

df = pd.read_json(os.path.join("..","..","data","TA_User_Reviws_Korea_all.json"))
df.head(5)

# 용량 큰 파일 다시 꼭 확인 후
git add .
git commit -m "커밋 메시지"
git pull
# pull 을 통해 서버에 있는 파일과 충돌 확인
# 만약 충돌이 있다면 해당 파일 들어가 해결 후 다시 처음부터 진행
git push

YN_model.py

parameter
`local_gloabal`	local을 추천받을지 global 추천받을지
`model`	`wnd` or `deepFM` 사용할 모델 지정.
`path`	local_df, global_df, vec이 존재하는 경로
`item_id`	`int` 1차 추천 호텔 리스트 중 사용자가 선택한 호텔 id
`top`	`int` 상위 몇개의 유사 아이템을 추천받을지. default 값은 10이다.

return value
top n 개의 유사 아이템(식당) 이름 및 주소

main.ipynb 참조

! python YN_model.py --local_gloabal 'local' --model 'wnd' --path "../realtime_model" --item_id 3477158 --top 10