/boostcamp-bookratingprediction-recsys-06

[Boostcamp AI Tech] Book rating prediction

Primary LanguageJupyter Notebook

image

Book Rating Prediction-Recsys 06 TEAM

상세한 프로젝트 내용은 발표자료 및 레포트를 참고해주세요!


팀원 소개

김성연 김찬호 박문순 배성수 이지훈

🏆️ 프로젝트 목표

  • 사용자의 책 평점 데이터를 바탕으로 사용자가 어떤 책을 더 선호할지 예측하는 태스크


💻 활용 장비

  • GPU Tesla V100-PCIE-32GB


🙋🏻‍♂️🏻‍♀️ 프로젝트 팀 구성 및 역할

  • 김성연: 팀의 방향성 설정 및 아이디어 제공, 데이터 EDA 진행, DeepCoNN 모델 실험해보기
  • 김찬호: 노션을 활용해 팀원의 진행과정 기록하기, TabNet 모델 실험해보기
  • 박문순: 깃허브 전반적인 버전 관리, FM, FFM 모델 실험해보기
  • 배성수: FFM+DCN 모델 구현 및 고도화 하기, Cold-Start 관련 분석해보기
  • 이지훈: 부스팅 기반 모델 실험해보기, K-fold 및 Wandb와 Optuna 등을 사용해 모델 고도화 하기


🏗️ Model Architecture

  • 범주형 데이터 처리에 좋은 성능을 내는 Catboost Model 이용


🛠 Project Template

  • 학습 환경의 경우 pytorch-template을 이용하여 이번 대회의 학습환경에 맞춰 리팩토링을 진행함


💯 프로젝트 수행 결과 - 최종 Private 1등

리더보드 auroc 순위
public 2.1095 1위
private 2.1045 최종 1위

image

모델 실행 순서

  1. FFDCN.ipynb 파일 실행 => submit/FFDCN.csv 파일 생성
  2. CatBoost.ipynb 파일 실행 => submit/CatBost.csv 파일 생성
  3. Ensemble.ipynb 파일 실행 => submit/Ensemble.csv 파일 생성