/clova-airush-2022

🥈 Top 2 in "Nonsense Documents Detection" & 🥉 Top 3 in "Unknown Documents Detection"

Primary LanguagePythonMIT LicenseMIT

NAVER AI RUSH 2022

airush

🥈 Top 2 in Round 1: Nonsense Documents Detection

🥉 Top 3 in Round 2: Unknown Documents Detection

Award Poster: Poster

Round1: Nonsens Documents Detection

Nonsense_docuement_detection

  • 엉터리 문서 (Nonsense Documents)
    • 문맥이 맞지 않은 단어들로 구성된 문서 혹은 단어의 순서를 바꾸어도 전혀 말이 되지 않는 문서를 의미한다.
  • 엉터리 문서를 Classification하는 Task

자세한 내용 보기

Round2: Unknown Documents Detection

Unknown_Detection_Task

  • 모델이 학습하지 않은 종류의 문서를 탐지하는 Task
  • 6개의 Class로 이루어진 Text Data를 학습
  • Test 시, 학습한 Data는 옳게 분류하고, 학습하지 않은 Data는 Unknown으로 분류
  • Multiclass Classification와 Unknown Detection이 결합된 형태의 Task

자세한 내용 보기