ko-nlp/Korpora

국립국어원 "개체명 분석 말뭉치 2020" 데이터에 modu_ne 로더 사용시 오류 발생

hyim opened this issue · 0 comments

hyim commented

기존 모두의 말뭉치 NE 로더 구현시 파일 가정과 "개체명 분석 말뭉치 2020(버전 1.0) - 2021.5.31 공개" 를 내려받았을 때 파일 형식이 일치하지 않습니다.

  • prefix 불일치: 현재 내려받는 파일에 파일 이름이 EXNE로 시작함
  • 문서 내용 가정 불일치: 대문자 "NE" 를 가정하고 찾고 있으나 파일 내용에 "ne"로 되어 있어 파싱 오류 발생