/Awesome-Korean-NLP-Papers

This repository provides list of Korean NLP papers.

Awesome Korean NLP Papers

This respository provides list of Korean NLP papers.

Feel free to

  • Add/Modify wrong or blank informations of papers.
  • Add/Modify wrong or blank informations of conferences.

And you can open issue

  • When a paper you want to find is missing.
  • Whenever else you want to contribute.

Please consider sending PR first. It is a great help to keep this list up-to-date.

Please, do not hesitate to create an issue. It always helps this repository to be informative and healthy.

Enjoy, and have a good day! :)

Index

  1. Conference and Journal List
  2. POS Tagging and Morpheme Analysis
  3. Dependency Parsing
  4. Named Entity Recognition
    1. ETRI dataset
    2. Other dataset
  5. Semantic Role Labeling
  6. Emotion Recognition
  7. Sentiment Analysis
  8. Coreference Resolution
  9. Question Answering
  10. Translation
  11. Dialogue Management
  12. Document Classification
  13. Document Summarization
  14. Image Captioning
  15. Keyword Extraction
  16. Grammatical Error Correction
  17. Relation Classification
  18. Natural Language Generation
  19. Speech Act Classification
  20. Abusive Detection
  21. Transliteration
  22. Document Similarity
  23. Automatic Speech Recognition
  24. Word Sense Disambiguation
  25. Tools
  26. Dataset

Conference and Journal List

Conference
/Journal
Date Web Page Paper List
2015 정보과학회
동계학술대회
2015. 12. 17. ~ 18. LINK
2016 HCLT 2016. 10. 7. ~ 8. LINK LINK
2017 HCLT 2017. 10. 13. ~ 14. LINK LINK

POS Tagging and Morpheme Analysis

Date Conference
/Journal
Paper Metric Dataset
2011. 5. 정보과학회논문지 한국어 형태소 분석을 위한 3단계 확률 모델
2011. 9. 인지과학회지 형태소 분석기 사용을 배제한
음절 단위의 한국어 품사 태깅
어절 ACC:96.31 -
2012. 5. 정보과학회논문지 기분석 부분 어절 사전을 활용한
한국어 형태소 분석기
ACC:95.84 세종
2012. 10. HCLT CRF에 기반한 한국어 형태소 분할 및 품사 태깅 F1:96.19 세종
2013. 1. 정보과학회논문지 음절 단위의 한국어 품사 태깅에서 원형 복원
2013. 10. HCLT CRF기반 한국어 형태소 분할 및 품사 태깅에서
두 단계 복합형태소 분해 방법
F1:97.23 세종
2013. 10. HCLT                     Semi-CRF or Linear-Chain CRF?
한국어 형태소 분할 및 품사 태깅을 위한 결합 모델 비교
CRF/F1:97.23
Semi-CRF/F1:96.83                
세종       
2013. 10. 정보과학회논문지 품사 태깅 말뭉치에서 추출한 n-gram을 이용한
음절 단위의 한국어 형태소 분석
코난
2013. 12. Structural SVM을 이용한
한국어 띄어쓰기 및 품사 태깅 결합 모델
F1:98.03
2014. 정보과학회논문지 래티스상의 구조적 분류에 기반한
한국어 형태소 분석 및 품사 태깅
F1:94.07 ETRI
2014. 6. KCC 구기반 통계적 모델을 이용한 한국어 형태소 분할 및 품사 태깅
2014. 12. 정보과학회
동계학술대회
딥러닝에 기반한 한국어 품사 태깅
2015. 11. 정보과학회논문지 딥 러닝을 이용한 한국어 형태소의 원형 복원 오류 수정
2016. 6. KCC Sequence-to-sequence 모델을 이용한
한국어 형태소 분석 및 품사 태깅
2016. 10. HCLT 품사 분포와 Bidirectional LSTM CRFs를
이용한 음절 단위 형태소 분석기
ACC:97.09
2016. 10. HCLT seq2seq 주의집중 모델을 이용한 형태소 분석 및 품사 태깅 음절 ACC:91.28 세종
2016. 10. HCLT 단순화된 어절을 단위로 하는 한국어 품사 태거 Precision:90.81
2017. 1. 정보과학회논문지 Sequence-to-sequence 모델을 이용한
한국어 형태소 분석 및 품사 태깅
F1:97.15 세종
2017. 6. KCC Sequence-to-Sequence 기반
다중 발화 후보를 이용한 형태소 분석기
F1:76.54
2017. 10. HCLT 오타에 강건한 자모 조합 임베딩 기반 한국어 품사 태깅 ACC:97.50

Dependency Parsing

Date Conference
/Journal
Paper Metric Dataset
2008. 10. HCLT CRFs를 이용한 강건한 한국어 의존구조 분석 UAS:87.30 세종+KIB
2008. 12. 한국어정보학회 SVM을 이용한 결정적 한국어 의존 구문분석 UAS:88.25 KIBS95
2010. 3. 한국시뮬레이션
학회논문지
다단계 구단위화를 이용한 고속 한국어 의존구조 분석 UAS:86.01
2011. 4. 정보과학회논문지 자질 가중치의 기계학습에 기반한 한국어 의존파싱 UAS:88.15 세종
2011 ACL-WorkShop
(SPMRL 2011)
Statistical Dependency Parsing in Korean:
From Corpus Generation To Automatic Parsing
UAS:85.47
LAS:83.74
FNC:94.57
세종
2013. 10. 정보과학회논문지 키어절을 이용한 새로운 한국어 구문분석 F1:87.03
2014. 1. 정보과학회논문지 지배소 후위 집합을 이용한
한국어 의존 구문 분석 알고리즘
UAS:87.52 세종
신경망과 제약만족 알고리즘을 이용한 한국어 구문분석
2015. 8. 정보과학회논문지 순환 신경망을 이용한 전이 기반 한국어 의존 구문 분석 UAS:90.33 KIBS
2015. 12. 정보과학회
동계학술대회
통계 정보를 이용한 구문분석 트리 후보의 순위화 방법
2016. 6. APIC-IST Improving Korean Dependency Parsing
performance using predicate-argument features
UAS/자동형태:84.39
LAS/자동형태:81.91
세종
KCC Stack LSTM을 이용한 전이 기반 한국어 의존 파싱
2016. 10. HCLT Sequence-to-sequence 모델을 이용한
한국어 구구조 구문 분석
F1:89.03 세종
2016. 10. HCLT Stack LSTM 기반 한국어 의존 파싱을 위한
음절과 형태소의 결합 단어 표상 방법
UAS/정답형태:93.65
LAS/정답형태:91.57
UAS/자동형태:90.44
LAS/자동형태:88.17
세종
2016. 10. HCLT 의존 경로와 음절단위 의존 관계명 분포 기반의
Bidirectional LSTM CRFs를 이용한
한국어 의존 관계명 레이블링
의존관계F1:96.01 세종
2016. 12. 정보과학회
동계학술대회
멀티 태스크 학습 기반
포인터 네트워크를 이용한 한국어 의존 구문 분석
UAS/자동형태:91.65
LAS/자동형태:89.34
세종
2017. 6. KCC Deep Biaffine Attention을 이용한 한국어 의존 파싱 UAS/자동형태:91.78
LAS/자동형태:89.76
세종
2017. 6. KCC 전이기반 순환유닛을 이용한
SyntaxNet 기반 한국어 의존 파싱
UAS:90.33
LAS:88.69
SPMRL '14
2019. 6. KCC BERT를 이용한 한국어 의존 구문 분석

Named Entity Recognition

ETRI dataset

Date Conference
/Journal
Paper Performance(F1)
/Dataset
Tagset
2006. 10. HCLT Conditional Random Fields를
이용한 세부 분류 개체명 인식
83.40/ETRI-QA ETRI-147
2010. 12. 인지과학회
논문지
Structural SVMs 및 Pegasos
알고리즘을 이용한 한국어 개체명 인식
86.79/ETRI-Sports
85.43/ETRI-TV
ETRI-15
2014. 12. KCC 딥러닝을 이용한 개체명 인식 89.03/ETRI-TV-PLO ETRI-PLO
2015. 12. 정보과학회
동계학술대회
Word Embeddings 자질을 이용한
한국어 개체명 인식 및 분류
89.03/ETRI-TV
89.98/ETRI-Sports
81.32/ETRI-IT
ETRI-15
2016. 6. 정보과학회논문지 Word Embedding 자질을 이용한
한국어 개체명 인식 및 분류
89.81/ETRI-TV
90.04/ETRI-Sports
2016. 6. KCC 문자 기반 LSTM CRF를 이용한 개체명 인식 86.53/ETRI ETRI
2016. 10. HCLT 문자 기반 LSTM-CRF 한국어
개체명 인식을 위한 사전 자질 활용
89.34/ETRI ETRI

Other dataset

Date Conference
/Journal
Paper Performance
(F1)
Tagset
(N of Tags)
2008. 6. 한국정보과학회
강원지부 학회논문
2단계 최대 엔트로피 모델을 이용한 한국어 개체명 인식 85.20 P, L, O
2010 기계학습 기반 개체명 인식을 위한 사전 자질 생성 90.40
2013 HCLT 대화형 개인 비서 시스템을 위한 하이브리드
방식의 개체명 및 문장목적 동시 인식기술
93.50 P, L, D, T, Cycle,
Title, Currency,
Number
2015. 6. KCC Long-Short-term memory 기반의
Recurrent Neural Network를 이용한 개체명 인식
2016. 6. KCC 개체명 사전과 원시 말뭉치를 이용한
준지도 학습 기반 개체명 인식 모델
96.70 (3)
2016. 2. 정보과학회논문지 원거리 감독과 능동 배깅을 이용한 개체명 인식 76.42 (11)
2016. 9. 정보처리학회논문지 조건부 랜덤 필드를 이용한 특허 문서의 개체명 인식 65.40 (5B+5I+O)
2016. 10. HCLT 품사 임베딩과 음절 단위 개체명 분포 기반의
Bidirectional LSTM CRFs를 이용한 개체명 인식
79.52
2016. 10. HCLT 의생명 분야의 개체명 인식에서 순환형 신경망과 조건적 임의 필드의 성능 비교 72.82
2016. 12. 정보과학회
동계학술대회
자소 편집거리를 이용한 한글 트위터 개체명 인식 83.51
2016. 12. 정보과학회
동계학술대회
식품 도메인 개체명 인식을 위한 문자 기반 LSTM CRF
2017. 3. 정보과학회논문지 Bidirectional LSTM CRF 기반의
개체명 인식을 위한 단어 표상의 확장
80.68
2017. 6. KCC CNN을 이용한 대화와 같은 짧은 문장에서 개체명 인식 88.56
2017. 6. KCC 순환 신경망과 합성곱 신경망을 이용한 개체명 인식 75.53
2017. 10. HCLT 한국어 특질을 고려한 단어 벡터의
Bi-LSTM 기반 개체명 모델 적용
2017. 12. 정보과학회논문지 자질 보강과 양방향 LSTM-CNN-CRF
기반의 한국어 개체명 인식 모델
89.40
2018. 1. HCI KOREA Highway Bi-LSTM-CRFs 모델을 이용한 멀티 태스크 기반 한국어 개체명 인식 83.77

Semantic Role Labeling

Date Conference
/Journal
Paper Metric
2015 정보과학회논문지 Structural SVM 기반의 한국어 의미역 결정 F1:76.04
2015. 6. KCC 딥 러닝을 이용한 한국어 의미역 결정 F1:76.96
2015. 12. 한국정보과학회
학술대회
Bidirectional LSTM CRF를 이용한
End-To-End 한국어 의미역 결정
F1:78.16
2015 인지과학회 한국어 의미역 결정을 위한 Korean PropBank
확장 및 도메인 적응 기술 적용
A study of Korean Semantic Role Labeling using Word sense
2016 Advanced Science and
Technology Letters
Korean Semantic Role Labeling
Using Korean PropBank Frame Files
ACC:90.00
2016. 10. HCLT 음절의 의미역 태그 분포를 이용한
Bidirectional LSTM CRFs 기반의 한국어 의미역 결정
F1:66.13
2016. 10. HCLT CRF를 이용한 복수 의미역 문제 해결 F1:74.47
2016. 10. HCLT Input-feeding RNN Search 모델과 CopyNet을 이용한 한국어 의미역 결정 어절AIC:71.58
Label AIC:79.42
2016. 10. HCLT 베이지안 모형 기반 한국어 의미역 유도 F1*:83.26
2016. 12. 정보과학회논문지 격틀 사전과 하위 범주 정보를 이용한 한국어 의미역 결정 F1:78.47
2017. 1. 정보과학회논문지 Stacked Bidirectional LSTM-CRFs를 이용한
한국어 의미역 결정
F1:78.57
2017. 6. KCC 형태 의미 정보를 이용한 한국어 의미역 결정 F1:77.36
2017. 6. KCC 문자 기반 LSTM CRF를 이용한 한국어 의미역 결정
2017 International Journal
of Database Theory
and Application
A Study of Dictionary Based
Korean Semantic Role Labeling
2017. 10. HCLT Highway BiLSTM-CRFs 모델을 이용한
한국어 의미역 결정
2019. 6. KCC BERT를 이용한 한국어 의미역 결정
2019. 6. KCC 한국어 ELMo 임베딩을 이용한 의미역 결정

Emotion Recognition

Date Conference
/Journal
Paper Metric Number of Tags
2002 석사학위논문 Hybrid Naive Bayes HMM 기법을 사용한
텍스트로부터의 감정 분류
7
2010 인지과학회 대화 시스템을 위한 사용자 발화 문장의 감정 분류 F1:62.80 9
2013. 6. 정보과학회논문지 한글 마이크로블로그 텍스트의
감정 분류 및 분석
2013. 11. 한국엔터테인먼트
산업학회 학술대회
기계 학습을 이용한 한글 텍스트 감정 분류 F1:72.00 9
2014. 6. KCC 기계 학습을 이용한 한글 텍스트 감정 분류 및 분석
2015. 10. HCLT 임베딩 자질을 이용한 대화의 감정 분류 ACC:72.89 9
2016. 10. HCLT CNN-LSTM을 이용한 대화 문맥 반영과 감정 분류 ACC:82.93 11

Sentiment Analysis

Date Conference
/Journal
Paper Metric Tagset
2010. 4. 정보과학회논문지 감정 단어의 의미적 특성을 반영한
한국어 문서 감정분류 시스템
F1:80.18 P/N
2012. 5. 언어과학연구 감성 분석 연구의 현황과 말뭉치에 기반한 사례 분석
: 영화평 자료를 중심으로
83.82 P/N
2014. 11. 대한산업공학회 SVM과 HCRF를 이용한 텍스트 문서 감정 분류 모델 F1:86.00 P/N
2014 Advanced Science and
Technology Letters
Sentiment Classification of Movie Reviews
Using Korean Sentiment Dictionary
ACC*:81.50 P/N
2014. 2. Journal of Korea
Multimedia Society
한국어 트위터의 감정 분류를 위한
기계학습의 실증적 비교
2015. 12. 정보과학회
동계학술대회
RNN과 attention mechanism을 이용한 감성분석 ACC:80.41 P/N
2016. 5. 정보처리학회논문지 감성 분석 및 감성 정보 부착 시스템 구현 ACC:76.00 P/N/N
2016. 10. HCLT WPM(Word Piece Model)을 활용한 구글 플레이스토어 앱의 댓글 감정 분석 연구 P/N
2016. 10. HCLT 영어 SentiWordNet을 이용하여 구축된 한국어 감성어휘사전의 성능과 한계 연구
2016. 10. HCLT MUSE 감성주석코퍼스를 활용한 문장 극성과 키워드 극성간의 불일치 현상에 대한 분석
2017. 2. 의미 정보가 강화된
워드 임베딩을 통한 감성 분석
ACC:82.30
2017. 6. KCC 합성 곱 신경망을 이용한 한글 텍스트 감성 분류기 설계 ACC:87.88
2017. 6. KCC Skip-Connected LSTM을 이용한 감성 분석 ACC:81.47

Coreference Resolution

Date Conference
/Journal
Paper Metric
2014. 6. KCC SVM 기반의 Mention Pair Model을 이용한 한국어 상호참조해결 F1:61.67
2014. 11. 정보과학회논문지 Multi-pass Sieve를 이용한 한국어 상호참조해결 MUC:58.97
CoNLL:60.65
2015. 4. 정보과학회논문지 SVM 기반의 멘션 페어 모델을 이용한한국어 상호참조해결 CEAFE-F1:61.75
2015. 6. KCC 딥러닝을 이용한 가이드 멘션페어 한국어 상호참조해결
2016. 2. 석사학위논문 규칙과 기계학습을 이용한 한국어 상호참조해결
2016. 6. KCC 시브 자질 기반 랜덤 포레스트를 이용한
한국어 상호참조 해결
CoNLL:62.00
2016. 10. HCLT 포인터 네트워크를 이용한 멘션 탐지 상호참조F1:52.69
멘션탐지F1:80.75
2016. 11. 정보처리학회논문지 랜덤 포레스트를 이용한 한국어 상호참조 해결
2016. 12. 정보과학회
동계학술대회
계층적 포인터 네트워크를 이용한 상호참조해결 F1:72.43
2017. 5. 정보과학회논문지 포인터 네트워크를 이용한
한국어 대명사 상호참조해결
81.40
2017. 6. KCC Bi-directional Multiple Timescale GRU 기반
포인터 네트워크를 이용한 상호참조해결
F1:71.05
2017. 6. KCC k-Max Pooling을 적용한
Cluster-Pair Encoder를 이용한 상호참조해결
MUC:64.05
F1:54.76
2019. 6. KCC BERT기반 Deep Biaffine을 이용한 한국어 상호참조해결
2019. 6. KCC 고차 추론을 이용한 한국어 End-to-end 신경망 기반 상호참조해결

Question Answering

Date Conference
/Journal
Paper Metric
2003 한국어 질의응답시스템을 위한 지지벡터기계 기반의 질의유형분류기
2004 한국어 질의응답시스템에서 구문정보에 기반한 질의분석 Precision*
어휘 의미 정보를 이용하는 질의응답 시스템의 질의유형 분류
2011 HCLT 실시간 검색어를 이용한 주제어 기반의 질의응답시스템
2012. 2. 정보과학회논문지 오픈 도메인 질의응답을 위한 검색문서 제약 및 정답유형 분류기술
2013 HCLT 질의 응답 시스템을 위한 반교사 기반의 정답 유형 분류
2014. 4. 정보처리학회논문지 Q&A 문서의 검색 결과 요약을 활용한 질의응답 시스템
2015. 10. ISWC NLIWoD
2015 Workshop
Design and Implementation of an Evaluator for Building
a Good Knowledge Base in Question Answering
2015. 12. 정보과학회
동계학술대회
질의응답 시스템에서 처음 보는 단어의 효율적인 처리
2016. 6. KCC 질의응답 시스템 성능 개선을 위한 질의 트리플 확장
2016. 10. HCLT 한국어 질의응답 시스템을 위한 프레임 시멘틱스 기반 질의 의미 분석 F1:81.37
2016. 10. HCLT 질의응답 시스템에서 형태소임베딩 모델과
GRU 인코더를 이용한 문장유사도 측정
TOP5*:51.63
2016. 10. HCLT 딥러닝과 정보검색을 결합한 질의응답 시스템
2017. 10. HCLT 심층적 의미 매칭을 이용한 cQA 시스템 질문 검색 P@1:51.5

Translation

Date Conference
/Journal
Paper Metric
2014. 8. 정보과학회논문지 위키피디아로부터 한국어-영어 병렬 문장 추출
2016. 10. HCLT 극한 언어 환경에 대응 가능한 영한 자동 주소번역 시스템 ACC:95.39
2016. 10. HCLT 말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구 BLEU:24.26

Dialogue Management

Date Conference
/Journal
Paper Metric
2014 정보과학회
동계학술대회
Hidden Markov Model을 이용한 대화 의도 모델링
2016. 10. HCLT 격틀과 워드 임베딩을 활용한 유사도 기반 대화 모델링 MRR:93.9
2016. 10. HCLT Long Short-Term Memory를 이용한 통합 대화 분석 감정ACC:58.08
화행ACC:82.60
서술자ACC:62.74
2016. 12. 정보과학회
동계학술대회
Konvbot: 한국어 대화 모델 - 아침, 가정환경을 중심으로
2017. 6. KCC 합성곱 신경망을 이용한 음절 표상의 학습을 통한
대화 시스템의 사용자 발화 의도 분석
ACC:92.84
2017. 6. KCC End-to-end learning을 이용한 한국어 단문 응답 시스템 개발
2017. 8. 컴퓨터교육학회 Hybrid Code Network를 이용한 한국어 식당 예약 시스템 모델
2017. 10. HCLT MTRNN을 이용한 한국어 대화 모델 생성 BLEU4:0.22
2017. 10. HCLT 도메인 특정 지식을 결합한 End-to-End Learning 방식의
한국어 식당 예약 대화 시스템 모델 개발
Per Response:0.95
Per Dialogue:0.64
2018. 10. HCLT 생성적 적대적 신경망을 이용한 생성기반 멀티턴 챗봇
2018. 10. HCLT 대화 시스템에서의 자연스러운 대화를 위한 Memory Attention 기반 Breakdown Detection
2018. 10. HCLT 기계독해 기반 질의응답 챗봇
2018. 10. HCLT Attention 기반의 대화 발화 예측 모델
2018. 10. HCLT 강건한 응답 생성을 위한 디노이징 메커니즘 기반 다중 디코더 대화 모델
2018. 10. HCLT 심층 순환 Q 네트워크 기반 목적 지향 대화 시스템
2018. 10. HCLT CNN Sequence-to-Sequence를 이용한 대화 시스템 생성
2018. 10. HCLT 멀티모달 자질을 활용한 다중 화자 대화 속 인물 식별
2018. 10. HCLT Memory Network를 이용한 한국어 목적 대화 시스템 개발
2019. 10. HCLT 한국어 챗봇에서의 오류에 강건한 한국어 문장 분류를 위한 어절 단위 임베딩
2019. 10. HCLT Dual WGAN 기반 페르소나 Multi-Turn 챗봇
2019. 10. HCLT 대화 시스템의 개체 생략 복원을 위한 유효 발화문 인식
2019. 10. HCLT 현실 세계를 제어하는 혼합 현실 대화 시스템

Document Classification

Date Conference
/Journal
Paper Metric
2012. 4. 한국전자거래학회
춘계학술대회
청킹 기반 특징 추출을 통한 문서 분류 시스템의 성능 향상
2016. 10. 문서 분류 알고리즘을 이용한 한국어 스팸 문서 분류 성능 비교 F1:98.40
2016. 10. HCLT Doc2Vec을 활용한 CNN기반
한국어 신문기사 분류에 관한 연구
2017. 6. KCC 한국어자모단위기반의 Convolution Neural Network를
이용한 텍스트 분류
2017. 10. HCLT 대규모 분류 체계에서 계층적 샘플링을 활용한 문서의 분류

Document Summarization

Date Conference
/Journal
Paper Metric
2016. 10. HCLT Copy Mechanism과 Input Feeding을 이용한
End-to-End 한국어 문서요약
ROUGE-1:35.92
ROUGE-2:15.37
ROUGE-L:29.45
2016. 12. 정보과학회
동계학술대회
lexrankr: LexRank 기반 한국어 다중 문서 요약 F1:53.40
2017. 5. 정보과학회논문지 복사 방법론과 입력 추가 구조를 이용한
End-to-End 한국어 문서요약
ROUGE-1:35.92
ROUGE-2:15.37
ROUGE-L:29.45

Image Captioning

Date Conference
/Journal
Paper
2015. 12. 정보과학회
동계학술대회
Recurrent Neural Network를 이용한 이미지 캡션 생성
2016. 8. 정보과학회논문지 Recurrent Neural Network를 이용한 이미지 캡션 생성
2016. 12. 정보과학회
동계학술대회
딥러닝을 이용한 한국어 이미지 캡션 생성
2017. 10. HCLT LSTM을 이용한 한국어 이미지 캡션 생성

Keyword Extraction

Date Conference
/Journal
Paper Metric
2002. 10. 정보과학회논문지 주성분 분석을 이용한 문서 주제어 추출
2010 한국정보통신
학회논문지
비감독 학습 기법에 의한 한국어의 키워드 추출 F1:65
2015. 2. 한국컴퓨터정보
학회논문지
TF-IDF와 소설 텍스트의 구조를 이용한 주제어 추출 연구
2016. 10. HCLT 한글 문서의 단어 동시 출현 정보에 개선된
TextRank를 적용한 키워드 자동 추출 기법

Grammatical Error Correction

Date Conference
/Journal
Paper Metric
2016. 6. KCC 딥러닝을 이용한 한국어 자동 띄어쓰기 어절F1:92.32
2016. 10. HCLT Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상
2017. 6. KCC 말뭉치 확장 기법을 이용한 음절 단위 한국어 문장 교정 시스템
2017 한글 편집거리 알고리즘을 이용한 한국어 철자오류 교정방법

Relation Classification

Date Conference
/Journal
Paper Metric
2017. 6. KCC Input Attention 기반 LSTM-CNN 모델을 이용한 Relation Classification F1:69.30

Natural Language Generation

Date Conference
/Journal
Paper Metric
2016. 10. HCLT 온톨로지 기반의 문서생성 시스템
2017. 6. KCC Sequence-to-sequence 모델을 이용한 자연어생성

Speech Act Classification

Date Conference
/Journal
Paper Metric
2011. 12. Journal of Computing Science and Engineering Review of Korean Speech Act Classification: Machine Learning Methods
2015. 1. Pattern Recognition
Letters
New feature weighting approaches for speech-act classification
2017. 6. KCC 대화문맥을 이용한 심층학습 기반 다중-태그 화행분석 모델
2017. 10. HCLT CNN-LSTM 신경망을 이용한 발화 분석 모델
2017. 10. HCLT CNN을 이용한 발화 주제 다중 분류 F1:98.73

Abusive Detection

Date Conference
/Journal
Paper Metric
2017. 6. KCC 반자동 학습 기반의 비속어 및 욕설 탐지 시스템 F1:84.23

Transliteration

Date Conference
/Journal
Paper Metric
2017. 10. HCLT Distance LSTM-CNN with Layer Normalization을 이용한음차 표기 대역 쌍 판별 F1:89.70

Document Similarity

Date Conference
/Journal
Paper Metric
2016. 10. HCLT 문서의 공기관계를 이용하여 국가 R&D 보고서간 유사도 계산

Automatic Speech Recognition

Date Conference
/Journal
Paper Metric
2016. 10. HCLT 음성 인식 오류 수정을 위한 Trie 기반 사전을 이용한 Guided Sequence Generation WER:7.05

Word Sense Disambiguation

Date Conference
/Journal
Paper Metric
2017. 10. HCLT 코어넷을 활용한 비지도 한국어 어의 중의성 해소

Tools

Date Conference
/Journal
Paper
2014 한국어 의미역 말뭉치 구축을 위한 반자동 태깅 도구 개발

Dataset

Date Conference
/Journal
Paper
2017. 10. HCLT 식당 예약 대화 시스템 개발을 위한 한국어 데이터셋 구축
2019. 6. KCC 다중 언어분석기 및 언어규칙 기반 반자동 구문분석 말뭉치 구축