fxsjy/jieba

未能成功标注词性

axty666 opened this issue · 1 comments

未能成功标注地名的词性,示例:

import jieba
import jieba.posseg as pseg
words = pseg.cut("滨州滨州市")
for word, flag in words:
    if flag == 'ns':
        print('%s' % (word))

结果输出了滨州,而没有滨州市

import jieba
import jieba.posseg as pseg
words = pseg.cut("滨州首尔冲绳")
for word, flag in words:
    if flag == 'ns':
        print('%s' % (word))

结果只输出了滨州 而没有首尔冲绳

而类似于北京北京市或者天津天津市这种的却能被正确识别
我怀疑是字典没有完整收录地名
添加自定义字典虽然能缓解这一问题,但未免看起来很奇怪