shineware/RKOMORAN

Update KOMORAN library version

gamamoe opened this issue · 1 comments

기능 설명

EXP 모델에서 NA로 분석되는 것을 수정한 KOMORAN library로 Update 및 관련 코드 수정

  • Library 업데이트
  • JVM heap 관련 설정

추가 정보

메일로 리포트 받은 내용

  1. STABLE

komoran <- RKOMORAN::RKOMORAN$new(model_type = "STABLE")
komoran$get_plain_text("샤인웨어에서는 어떤 활동을 하나요?")
[1] "샤인/NNP 웨어/NNG 에서/JKB 는/JX 어떤/MM 활동/NNG 을/JKO 하/VX 나요/EF ?/SF"

komoran$get_plain_text("넌 내게 잘해준 유일한 사람이었어")
[1] "너/NP ᆫ/JX 내/VV 게/EC 잘/MAG 하/XSV 아/EC 주/VX ᆫ/ETM 유일한/NNP 사람/NNG 이/VCP 었/EP 어/EC"

komoran$get_nouns("넌 내게 잘해준 유일한 사람이었어")
[1] "유일한" "사람"

komoran$get_plain_text("구글의 신기술을 바짝 쫒아왔다.") # 간혹 형태소분석을 하지 못하는 경우 발생 -> "쫒아왔다"는 오타
[1] "구글의 신기술을 바짝 쫒아왔다./NA"

  1. EXP

komoran <- RKOMORAN::RKOMORAN$new(model_type = "EXP")
komoran$get_plain_text("샤인웨어에서는 어떤 활동을 하나요?")
[1] "샤인웨어에서는 어떤 활동을 하나요?/NA"

komoran$get_plain_text("넌 내게 잘해준 유일한 사람이었어")
[1] "넌 내게 잘해준 유일한 사람이었어/NA"

komoran$get_nouns("넌 내게 잘해준 유일한 사람이었어")
Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, :
java.lang.IndexOutOfBoundsException: Index 0 out of bounds for length 0

komoran <- RKOMORAN::RKOMORAN$new(model_type = "EXP") # 불러올때 문제가 생기기도 합니다.
Error in rJava::.jnew("kr/co/shineware/nlp/komoran/core/Komoran", model) :
java.lang.OutOfMemoryError: Java heap space

#10 has been applied to resolve this issue