/BOAZ_adv_project

빅데이터 동아리 BOAZ ADV project - Recommeder System

Primary LanguageJupyter Notebook

추천시스템

timeline

  • [2019-02-21] : 첫 회의. 각자 추천시스템에 대해 공부할 것 정함

  • [2019-02-25] : 추천시스템 알아가기

  • [2019-03-07] : 데이터 다운로드 & EDA 진행

    - 회의내용

    • y 파악하기
    • session id, user id 파악하기
    • 강의 5,6,7 들어오기
    • session_based rs 조사하기
  • [2019-03-08] : EDA

  • [2019-03-13] : 파이썬 머신러닝

  • [2019-03-14] : surprise 패키지 공부

  • [2019-03-15] : 회의

    - 회의내용

    • 샘플코드 공부할 것.
    • 데이터 공부, 모델 공부
  • [2019-03-20] : last_date & click 추가해서 submission 점수x

  • [2019-03-21] : only last_date submission 점수x

  • [2019-03-29] : 주최 측에서 데이터

  • [2019-05-02] : 새로운 마음으로 화이팅! 5/7 각자 한 거 결과 보고 & ppt 상의

RecSys 2019

데이터 개요

시간

  • train data : 2018-11-01 00:00:08~ 2018-11-06 23:59:59 / test data : 2018-11-07 00:00:07 ~ 2018-11-08 23:59:59

데이터 개수

  • train data : user ID 개수 - 730803, session ID 개수 : 910683
  • test data : user ID 개수 - 250852, session ID 개수 : 291381
  • train + test : user ID 개수 - 948041, session ID 개수 : 1202048
  • train에만 있는 user_id 개수 697189 / test에만 있는 user_id 개수 217238
  • train, test 모두 포함하는 user_id 개수 33614
  • train에만 있는 session_id 개수 910667 / test에만 있는 session_id 개수 291365
  • train, test 모두 포함하는 session_id 개수 16
  • item_meta 데이터에는 unique한 927142개의 item에 대한 특성에 대한 정보가 있다.

알게 된 것

  • 다른 날이어도 같은 session_id가 있을 수 있다.

관련자료 공부

제목 저자 정리 link
Factorization Machines (link) Steffen Rendle
Latent Relational Metric Learning via Memory-based Attention for Collaborative Ranking (link) Yi Tay, Luu Anh tuan, Siu Cheung Hui
Sequential Recommender System based on Hierarchical Attention Network (link) Haochao Ying, Fuzhen Zhuang, Yanchi Liu...
Wide & Deep Learning for Recommender Systems (link) Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen...

[2019-06-22] 컨퍼런스 발표 회의 [2019-06-23] [2019-06-24] 리허설에 할 것 준비. item 별 dwelling time [2019-06-27] 컨퍼런스 리허설 [2019-07-04] test2 data 완성! [2019-07-13] 발표 끝!!!!!!!!!

끝났다아아아아!!!!!!!!! 얘들아 다들 너무 고생많았고, 수고했어!!!!!