结巴中文分词HTTP服务。
g++ (version >= 4.1 is recommended) or clang++
;cmake (version >= 2.6 is recommended)
;
git clone --depth=10 --branch=master git://github.com/yanyiwu/cppjieba-server.git
cd cppjieba-server
mkdir build
cd build
cmake ..
make
服务默认使用 MixSegment 切词方式,如果想要修改成其他方式,请参考 src/server.cpp
源码文件。
将对应的方式的代码行注释去掉,重新编译即可。
./bin/cjserver ../conf/server_example.conf
curl "http://127.0.0.1:11200/?key=南京市长江大桥"
["南京市", "长江大桥"]
curl "http://127.0.0.1:11200/?key=南京市长江大桥&format=simple"
南京市 长江大桥
默认切词算法是MixSegment切词算法,如果想要使用其他算法切词,可以使用参数method来设置。 示例如下:
curl "http://127.0.0.1:11200/?key=南京市长江大桥&format=simple&method=MP"
curl "http://127.0.0.1:11200/?key=南京市长江大桥&format=simple&method=HMM"
curl "http://127.0.0.1:11200/?key=南京市长江大桥&format=simple&method=MIX"
curl "http://127.0.0.1:11200/?key=南京市长江大桥&format=simple&method=FULL"
curl "http://127.0.0.1:11200/?key=南京市长江大桥&format=simple&method=QUERY"
用 chrome 浏览器打开也行 ( chrome 设置默认编码是utf-8
):
同时,也支持HTTP POST模式,使用如下调用:
curl -d "南京市长江大桥" "http://127.0.0.1:11200/"
返回结果如下:
["南京市", "长江大桥"]
因为 HTTP GET 请求有长度限制,如果需要请求长文的,请使用POST请求。
如果有需要安装使用的,可以按照如下操作:
sudo make install
cd /usr/local/cppjieba-server
./script/cjserver.start
./script/cjserver.stop
rm -rf /usr/local/cppjieba-server
- Email:
i@yanyiwu.com
- QQ: 64162451