Challenges in Generalization in Open Domain Question Answering

Question

Opened this issue 2 years ago · 0 comments

발전된 LM모델도 최근 연구에서 적대적 샘플과 분포 외 샘플이 수많은 작업에 걸쳐 기존 모델에 대해 여전히 어려운 것으로 밝혀졌기 때문에 아직 일반화할 수 있는 언어 이해를 얻지 못하고 있다는 것은 분명함.

본 논문에서는 이전에 나왔던 ODQA(Open Domain QA) dataset인 TriviaQA, WebQuestions를 분해하여 수동으로 주석을 추가했다.

문제의 원인중 하나로 질문 구조 자체일 수 있으며 분해 접근 방식의 부산물로 각 질문에 대한 높은 수준의 질문 패턴을 도출 할 수 있다.

요약하자면