pyltp 是 语言技术平台(Language Technology Platform, LTP)的 Python 封装。
在使用 pyltp 之前,您需要简要了解 语言技术平台(LTP) 能否帮助您解决问题。
Py2.6 | Py2.6 | Py3.4 | Py3.5 | Py3.6 | conda-python | |
---|---|---|---|---|---|---|
Linux | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 |
Mac OS | 支持 | 支持 | 支持 | 支持 | 支持 | 不支持 |
Windows VS2015 | 不支持 | 不支持 | 不支持 | 支持 | 支持 | 不支持 |
Windows VS2017 | 不支持 | 不支持 | 不支持 | 支持 | 支持 | 不支持 |
下面是一个使用 pyltp 进行分词的例子
# -*- coding: utf-8 -*-
from pyltp import Segmentor
segmentor = Segmentor()
segmentor.load("/path/to/your/cws/model")
words = segmentor.segment("元芳你怎么看")
print "|".join(words)
segmentor.release()
除了分词之外,pyltp 还提供词性标注、命名实体识别、依存句法分析、语义角色标注等功能。
详细使用方法请参考 在线文档。
-
第一步,安装 pyltp
使用 pip 安装
$ pip install pyltp
或从源代码安装
$ git clone https://github.com/HIT-SCIR/pyltp $ git submodule init $ git submodule update $ python setup.py install # Mac系统出现版本问题使用 MACOSX_DEPLOYMENT_TARGET=10.7 python setup.py install
-
第二步,下载模型文件
七牛云,当前模型版本 3.4.0
- pyltp 版本:0.2.0
- LTP 版本:3.4.0
- 模型版本:3.4.0
- 徐梓翔 << zxxu@ir.hit.edu.cn >> 2015-01-20 解决跨平台运行问题
- 刘一佳 << yjliu@ir.hit.edu.cn >> 2014-06-12 重组项目
- HuangFJ << biohfj@gmail.com >> 本项目最初作者