/pyltp

pyltp: the python extension for LTP

Primary LanguageC++

pyltp: the python extension for LTP

Pypi Status Build Status

pyltp是语言技术平台(Language Technology Platform, LTP)的Python封装。 关于LTP更多的信息,欢迎访问LTP项目主页。

简介与背景知识

pyltp是语言技术平台(Language Technology Platform, LTP)接口的一个Python封装。 本项目旨在使Python用户可以本地调用LTP。 该项目还处于测试状态,欢迎反馈bug。

在使用pyltp之前,您需要简要了解

一个简单的例子

下面是使用pyltp进行分词的一个例子

# -*- coding: utf-8 -*-
from pyltp import Segmentor
segmentor = Segmentor()
segmentor.load("/path/to/your/cws/model")
words = segmentor.segment("元芳你怎么看")
print "|".join(words)
segmentor.release()

除了分词之外,pyltp还提供词性标注、命名实体识别、依存句法分析、语义角色标注等功能。 更多例子,请参考示例代码example/example.py

安装

现阶段,pyltp主要在Linux编译测试。我们也欢迎用户提供其他平台的测试结果。

  • 第一步,安装pyltp

使用pypi安装

$ pip install pyltp

或从github源代码安装

$ git clone https://github.com/HIT-SCIR/pyltp
$ git submodule init
$ git submodule update
$ python setup.py build
  • 第二步,下载模型文件

当前模型版本:3.3.0

下载地址百度云

版本对应

  • LTP版本: 3.3.0
  • 模型版本: 3.3.0

作者