/level1_bookratingprediction_recsys-level1-recsys-01

책 추천 대회 : 네이버 커넥트재단 부스트캠프 AI Tech 부스트캠프 AI Tech 4기 추천시스템 교육 중 진행된 대회

Primary LanguagePython

Check

  • 강의에서 배운 모델을 직접 코드를 통해 구현하면서 Trial & Error 을 경험해보기
    • 사전 제공된 모델을 원본 그대로 또는 파라미터 값을 변경하는 수준에서 사용하기 보다는 직접 구현해보자.
  • 점수나 등수에 너무 열중하지 않기
    • 지식 점검, 실전 사용 훈련 과정이라고 생각하자.
  • 대회의 기간이 짧으므로 파이프라인을 빠르게 구축하고 다양한 모델을 실험해보는 것
    • 전처리, 모델링, 모델 평가 과정을 먼저 구축한 후 각 스텝별로 다양한 실험을 해보는 것

참고사항

image

  • 서버는 한 번만 생성할 수 있음
    • 주피터랩 , ssh 로 접근 가능
    • 노트북 생성 시 받은 key 가 있는 폴더에서 명령어 입력
    • image
      • password 입력 창이 뜨면 key 가 제대로 있는지 확인해보기
    • ★ 주피터 노트북의 셧다운은 하지 마세요.
    • 서버 일시정지는 굳이 안해도 됩니다.
    • 대회 끝날 때 서버 종료 : 노트북 이름 입력
  • 제출은 하루 10회 ( timeout, fail 은 횟수 카운트 안됨 )
  • 팀 초대 메시지는 꼭 리더 가 해야 함.
    • 팀 결성되면 해체할 수 없음
  • 컨테이너를 다시 만들고 싶으면 종료 버튼 클릭 후 새 서버 생성
    • 서버 종료 시 백업을 미리 해두어야 함
  • GPU 사용 등 기본 환경은 설정되어 있음
  • 포트 : 컨테이너에서 사용할 수 있는 포트 개수
    • 16개까지 설정 가능
    • 포트 번호로 컨테이너 접근 가능
  • cuda.empty_cache()와 같은 메모리 관련 함수 사용 ?
    • 미답변
  • ★ 서버 용량을 수시로 확인해주어야 함
    • df -f 로 용량 확인 시 100GB 이상이 안되도록 확인해주어야 함
    • 예를 들어 컨테이너 접근이 안될 때 등
      • 용량 초과시 컨테이너 접근 안됨

GOAL

추천시스템의 전반적인 방법론과 실습 및 미션을 통해 추천시스템의 전체적인 파이프라인을 경험해보자.

  • Recommender system 태스크에 대한 이해
  • Recommender system 도메인의 여러 모델 중 반드시 알고가야 할 모델들에 대한 이해 및 구현 능력 함양
  • 실제 환경(경진대회, 실무)에서 Recommender system 문제를 잘 해결할 수 있는 능력 함양
  • 미래의 Recommender system 페이퍼를 스스로 읽고, 구현 및 본인의 상황에 응용 할 수 있는 능력 함양

DataSet

목적

사용자의 책 평점 데이터를 바탕으로 사용자가 어떤 책을 더 선호할지 예측하는 모델을 구축

제공

  • 책에 대한 메타 데이터인 books
  • 고객에 대한 메타 데이터인 users
  • 고객이 책에 남긴 평점 ratings

예측 값

  • 1과 10 사이 평점