Issues
- 1
Renew soynlp
#146 opened by lovit - 0
poetry, pre-commit 도입
#144 opened by lovit - 0
- 0
Noun Extractor refactoring
#105 opened by lovit - 0
vectorizer refactoring
#142 opened by lovit - 0
tokenizer refactoring
#143 opened by lovit - 0
postagger refactoring
#141 opened by lovit - 6
sent_to_word_contexts_matrix 내 dynamic_weight 관련 문제
#137 opened by smbslt3 - 0
noun_extractor 문의
#139 opened by imji0319 - 0
emoticon_normalize 관련 문제
#136 opened by smbslt3 - 0
데이터프레임에서 특정 컬럼값 적용시 local변수 에러 발생..
#135 opened by johnny9210 - 0
규칙기반 명사 추출 후처리 기능을 선택적으로 이용할 수 있으면 편리할 듯 합니다.
#134 opened by shoutmen - 0
vectorizer 가 있으면 편리할 것 같습니다.
#133 opened by shoutmen - 1
Bigram refactoring
#117 opened by lovit - 1
PMI refactoring
#116 opened by lovit - 0
WordExtractor refactoring
#115 opened by lovit - 3
- 1
명사 추출기에서 기구축된 사전을 base dictionary로 활용
#131 opened by hungry-wook - 1
NewsNounExtractor 내 지역 변수 선언 관련 오류
#129 opened by hungry-wook - 0
Normalizer refactoring
#124 opened by lovit - 0
- 2
python 3.7 버전에서 지역 변수 사용 시 오류가 납니다.
#101 opened by robin-kkk - 0
remove_eojeol function refac
#110 opened by hungry-wook - 0
PMI 함수의 위치 변경
#118 opened by lovit - 2
[Question] 학습데이터에 대한 format
#114 opened by SHwan93 - 1
모든 postagger 기본 dictionary 설치 가능할까요?
#111 opened by cheesama - 2
- 1
RegexTokenizer 호출 시, 단어 내 's' 기준으로 분리되는 이슈
#106 opened by hank110 - 0
docstring 작성 및 문서화
#102 opened by hungry-wook - 1
BaseVectorizer to_file() 문제
#99 opened by km19809 - 0
Unicodedata 를 이용한 normalizer, decomposer 수정
#97 opened by lovit - 0
Noun Extractor: "N+화" 추출
#96 opened by lovit - 0
Noun Extractor - compound noun 필터링 에러
#95 opened by hank110 - 4
Noun extractor covered eojeols 관련 질문
#94 opened by jeongwookie - 2
noun_extractor.train(sents)의 local error 문제
#92 opened by eomlocal - 0
noun extractor 이슈
#90 opened by zidane100e - 1
Noun Extractor 사용 질문
#89 opened by dandelin - 0
SimpleTagger에 postprocessor가 있어도 단어가 출력되지 않는 문제
#88 opened by gem763 - 0
단순한 Tokenizer 인터페이스
#87 opened by Wook0129 - 0
'ㅆㅡㄹㅐㄱㅣ' 로 입력된 글자를 '쓰래기' 로 정규하하여 처리
#86 opened by lovit - 0
Lemmatizer 의 속도 개선
#85 opened by lovit - 1
soynlp 설치시 에러
#83 opened by shuuki4 - 0
어절이 명사로 추출되는 경우
#81 opened by lovit - 0
#77 에서 추출된 어간으로 인식되는 용언의 어미를 eomi set 에서 제외
#79 opened by lovit - 1
대화데이터에서는 두 개의 용언이 붙여쓰이는 경우가 많으므로, 이로부터 어간을 먼저 추출
#77 opened by lovit - 0
복합 용언 추출 시 단일 용언을 제외
#78 opened by lovit - 0
문맥정보를 학습하기 위해 단어 (조사, 어미 제외) 간 correlation 학습
#76 opened by lovit - 0
띄어쓰기가 잘 되어있지 않은 데이터에서 두 어절과 어간이 혼동되는 경우
#75 opened by lovit - 0
(아니, 었다)의 활용이 축약형만 됨
#74 opened by lovit - 1
ㅎ 탈락 불규칙 예외 -놓
#73 opened by lovit