lovit/soynlp

모든 postagger 기본 dictionary 설치 가능할까요?

cheesama opened this issue · 1 comments

안녕하세요 좋은 패키지를 만들어 주셔서 감사합니다. 덕분에 유용하게 쓰고 있습니다.
기존에 잘 정리된 기본 postagger 용 dictionary가 있는데요
현재 setup.py에는
postagger/dictionary/default//.txt 만 되어 있어 설치해서 쓰려고 하면 default밖에 못가져오네요
이걸,
postagger/dictionary///*.txt 하여 모든 타입의 dictionary가 설치시 같이 복사되면 어떨까요?
(물론 패키지 설치 용량이 조금 커지긴 할 겁니다)
특히, Noun tag에 대하여 default로 쓰기는 부족해 보여 다른 것도 같이 쓴다면 더 쓰기 좋은 postagger 가 될 수 있을 것 같습니다.

lovit commented

@cheesama

좋은 의견 감사합니다. 현재 이 패키지의 리팩토링을 진행중인데, postagger 를 만들 때 기 정의된 단어 사전을 이름으로 이용하는 방법과 사용자 directory 를 입력하면 해당 위치에 존재하는 사전을 이용하는 방법을 제공하도록 하겠습니다.

예상되는 인터페이스는 아래와 같습니다.

postagger = PosTagger(dictionary='default')  # 존재하지 않을 시 자동으로 fetch
postagger = PosTagger(dictionary='news')
postagger = PosTagger(dictionary='path/to/my/dictionary')

그리고 기본 사전을 미리 다운받을 수 있도록 다음의 기능도 제공하려 합니다.
혹은 기본 사전은 패키지 설치 시 다운로드 되도록 할 수도 있습니다.

PosTagger.download_dictionary(name='all')
PosTagger.download_dictionary(name='news')

위와 같은 인터페이스로 제공된다면 유용할지 의견 부탁드립니다.