/LSTM_for_Chinese_word_segment

lstm实现基于字的中文分词

Primary LanguagePython

基于LSTM的中文分词系统

分词效果:

[In]

《九州缥缈录》是江南的幻想史诗巨著,共6卷。以虚构的“九州”世界为背景,徐徐展开一轴腥风血雨的乱世长卷。

[Out]

['《', '九州缥缈录', '》', '是', '江南', '的', '幻想', '史诗', '巨著', ',', '共', '6卷', '。', '以', '虚构', '的', '“', '九州', '”', '世界', '为', '背景', ',', '徐徐展开', '一', '轴', '腥风', '血雨', '的', '乱世', '长卷', '。']

[In]

**科学院大学软件研究所成立于1985年3月,是一个以计算机科学理论和应用研究为基础、以计算机软件研究开发和高新技术的 产业建设为主导的综合性基地型研究所。

[Out]

['**科学院大学软件研究所', '成立', '于', '1985年3月', ',', '是', '一个', '以', '计算机', '科学', '理论', '和', '应用', '研究', '为', '基础', '、', '以', '计算机', '软件', '研究', '开发', '和', '高新技术', '的', '产业', '建设', '为', '主导', '的', '综合性', '基地', '型', '研究所', '。']