lancopku/pkuseg-python

词性标注效果过好

axty666 opened this issue · 1 comments

理论上来讲效果好是一件好事,但是实际测试来讲会把不存在的地名也认作为地名

import pkuseg
seg = pkuseg.pkuseg(postag=True)
text = seg.cut('广场镇是河北天津衡水冲绳东京的旧地狱和亚特兰斯地吗?')
for word, flag in text: 
    if flag == 'ns':
        print (word)

输出结果为:

广场镇
河北
天津
衡水
冲绳
东京
亚特兰斯