lovit/soynlp

한국어 자연어처리를 위한 파이썬 라이브러리입니다. 단어 추출/ 토크나이저 / 품사판별/ 전처리의 기능을 제공합니다.

PythonNOASSERTION

Issues

Renew soynlp
#146 opened 8 months ago by lovit
1
poetry, pre-commit 도입
#144 opened 2 years ago by lovit
0
_noun_postprocessing.py 에서 josapath, suffixpath 코드 수정 건의
#145 opened 2 years ago by cvcatullus
0
Noun Extractor refactoring
#105 opened 4 years ago by lovit
0
vectorizer refactoring
#142 opened 2 years ago by lovit
0
tokenizer refactoring
#143 opened 2 years ago by lovit
0
postagger refactoring
#141 opened 2 years ago by lovit
0
sent_to_word_contexts_matrix 내 dynamic_weight 관련 문제
#137 opened 3 years ago by smbslt3
6
noun_extractor 문의
#139 opened 3 years ago by imji0319
0
emoticon_normalize 관련 문제
#136 opened 3 years ago by smbslt3
0
데이터프레임에서 특정 컬럼값 적용시 local변수 에러 발생..
#135 opened 3 years ago by johnny9210
0
규칙기반 명사 추출 후처리 기능을 선택적으로 이용할 수 있으면 편리할 듯 합니다.
#134 opened 4 years ago by shoutmen
0
vectorizer 가 있으면 편리할 것 같습니다.
#133 opened 4 years ago by shoutmen
0
Bigram refactoring
#117 opened 4 years ago by lovit
1
PMI refactoring
#116 opened 4 years ago by lovit
1
WordExtractor refactoring
#115 opened 4 years ago by lovit
0
NewsNounExtractor base_noun_dictionary argument 사용 시 오류
#130 opened 4 years ago by hungry-wook
3
명사 추출기에서 기구축된 사전을 base dictionary로 활용
#131 opened 4 years ago by hungry-wook
1
NewsNounExtractor 내 지역 변수 선언 관련 오류
#129 opened 4 years ago by hungry-wook
1
Normalizer refactoring
#124 opened 4 years ago by lovit
0
CI 적용
#125 opened 4 years ago by lovit
0
python 3.7 버전에서 지역 변수 사용 시 오류가 납니다.
#101 opened 5 years ago by robin-kkk
2
remove_eojeol function refac
#110 opened 4 years ago by hungry-wook
0
PMI 함수의 위치 변경
#118 opened 4 years ago by lovit
0
[Question] 학습데이터에 대한 format
#114 opened 4 years ago by SHwan93
2
모든 postagger 기본 dictionary 설치 가능할까요?
#111 opened 4 years ago by cheesama
1
soynlp.normalizer의 repeat_normalize에 문제가 있는 것 같습니다.
#108 opened 4 years ago by seunghyukcho
2
RegexTokenizer 호출 시, 단어 내 's' 기준으로 분리되는 이슈
#106 opened 4 years ago by hank110
1
docstring 작성 및 문서화
#102 opened 4 years ago by hungry-wook
0
BaseVectorizer to_file() 문제
#99 opened 5 years ago by km19809
1
Unicodedata 를 이용한 normalizer, decomposer 수정
#97 opened 5 years ago by lovit
0
Noun Extractor: "N+화" 추출
#96 opened 5 years ago by lovit
0
Noun Extractor - compound noun 필터링 에러
#95 opened 5 years ago by hank110
0
Noun extractor covered eojeols 관련 질문
#94 opened 5 years ago by jeongwookie
4
noun_extractor.train(sents)의 local error 문제
#92 opened 5 years ago by eomlocal
2
noun extractor 이슈
#90 opened 6 years ago by zidane100e
0
Noun Extractor 사용 질문
#89 opened 6 years ago by dandelin
1
SimpleTagger에 postprocessor가 있어도 단어가 출력되지 않는 문제
#88 opened 6 years ago by gem763
0
단순한 Tokenizer 인터페이스
#87 opened 6 years ago by Wook0129
0
'ㅆㅡㄹㅐㄱㅣ' 로 입력된 글자를 '쓰래기' 로 정규하하여 처리
#86 opened 6 years ago by lovit
0
Lemmatizer 의 속도 개선
#85 opened 6 years ago by lovit
0
soynlp 설치시 에러
#83 opened 6 years ago by shuuki4
1
어절이 명사로 추출되는 경우
#81 opened 6 years ago by lovit
0
#77 에서 추출된 어간으로 인식되는 용언의 어미를 eomi set 에서 제외
#79 opened 6 years ago by lovit
0
대화데이터에서는 두 개의 용언이 붙여쓰이는 경우가 많으므로, 이로부터 어간을 먼저 추출
#77 opened 6 years ago by lovit
1
복합 용언 추출 시 단일 용언을 제외
#78 opened 6 years ago by lovit
0
문맥정보를 학습하기 위해 단어 (조사, 어미 제외) 간 correlation 학습
#76 opened 6 years ago by lovit
0
띄어쓰기가 잘 되어있지 않은 데이터에서 두 어절과 어간이 혼동되는 경우
#75 opened 6 years ago by lovit
0
(아니, 었다)의 활용이 축약형만 됨
#74 opened 6 years ago by lovit
0
ㅎ 탈락 불규칙 예외 -놓
#73 opened 6 years ago by lovit
1