2021.11.18 ~ 2021.12.13 KDT Final ResSys Project
- OBJECT : 유저 행동 로그를 기반으로 관심을 가질 만한 광고주를 팔로우 추천 기능으로 제시. 팔로우한 샵 피드 기능 활성화
- DATA : 번개장터 실무 데이터. 8월 31일 하루 분. 유저 로그 & 광고주 데이터
- SOLUTION :
- 유저-광고주 간의 유사도 파악
- RANK 파악을 위해 유사도 측정 및 TOP K 랭킹 측정 문제
- 프로젝트 진행 환경 - Colab & Kaggle 노트북
본 프로젝트는 팔로우 기능의 활성화를 중심으로 유저 중심의 새로운 추천 시스템을 제안하고자 한다.
자주 본 광고 카테고리, 주로 판매하는 물건 카테고리가 유사한 판매자를 추천하는 BM을 구축한다면 더욱 다양한 수익구조의 기회를 만들어낼 수 있다고 판단하기 때문이다.
헤비 셀러나 특정 카테고리에서의 포텐셜을 갖는 '판매자'를 유저에게 추천하는 것이 본 프로젝트의 목적이므로, 한 유저와 비슷한 광고주를 파악해서 매칭해주는 추천 문제로 Task를 정의한다.
즉, 유저 기반으로 계산된 유사도를 기반으로 다양한 CF 기법을 활용하여, 높은 Score가 예측되는 유저(광고주) Top K 명을 추천하는 랭킹 문제로 기술적 문제 항목을 구체화. Recommender System을 개발한다.
- 가설
- User(광고에 노출이 된 유저)가 광고를 클릭 또는 노출된 횟수를 advertiser에 매기는 점수라고 가정
- 먼저, User가 클릭 한 로그들을 Advertiser별로 카운팅
- 이를 바탕으로 user-Advertiser matrix를 형성
- matrix 내에서는 클릭/노출 로그가 없으면 0이고, 존재한다면 1 이상의 값을 보임
- 이를 바탕으로 collaborative Filtering을 기반으로 한 추천시스템을 개발
부족한 Dataset로 인한 모델 신뢰도 저하 - 학습 목적에 맞는 Dataset 추가
명확한 Label의 부재로 인한 성능평가 불가 - Labeling 작업
최적 모델 연구