/level2_dkt-recsys-07

level2_dkt-recsys-07 created by GitHub Classroom

Primary LanguageJupyter Notebook

DKT : 학생별 문제 풀이 기록 학습을 통한 특정 문제 정오답 예측

Contributors

김지연 음이레 오승민 조재오 윤한나

활용 장비 및 재료(개발 환경, 협업 tool 등)

항목 설명
환경 • 로컬 환경: Windows, Mac
• 서버: Linux (Tesla V100), 88GB RAM Server
• 협업 Tool: Slack, Notion, Github
• 사용 버전: Python == 3.10.11, Pandas == 2.0.0, Torch == 1.7.1
Metric AUROC Score, Accuracy Score
Dataset - train/test 총합 7442명의 사용자의 학습 기록
- train_data.csv: 2266586개의 문항 풀이 기록
- test_data.csv: 260114개의 문항 풀이 기록
- 시계열 데이터, 총 6개의 특성
각 사용자의 마지막 풀이에 대한 answerCode는 -1로 기록

Project architecture

├─EDA
├─feature_engineering
├─models
│  ├─dkt
│  ├─LGBM
│  ├─lightgcn
│  ├─Transformer
│  └─Rule_based
├─postprocessing
└─preprocessing

구성

  1. 시퀀스 데이터를 일반적인 지도 학습 모델로 학습하기 위한 Memory Feature 추가
  2. Sequence Model 활용
  3. Graph 기반 모델 활용

프로젝트 수행 절차 및 방법

image

프로젝트 수행 결과

image

image

최종 순위

  • Private 2위 (AUC: 0.8579, ACC: 0.7903)

image