/zh2py

汉字转拼音,简单高效

Primary LanguageShell

Zh2py -- 汉字转拼音方案

zh2py是一个简单而高效的汉字转拼音方案,提供php和python扩展,

实现方式:将汉字转换成数字序号,然后去词表数组中查询拼音.词表已经事先生成好, 存储在dict/gbk.dict中,由mmap加载.

示例:

<?php
if(zh2py_load_table("../dict/gbk.dict")){
 $chinese = "测试数据";
 print zh2py_get_pinyin($chinese)."\n";
}
#!/usr/bin/env python
import zh2py
zy = zh2py.Zh2Py()
zy.load_table("../dict/gbk.dict")
data = open("./testdata/gbkall").read()
print zy.get_pinyin(data)
print zy.get_pinyin(data)

本项目还整理了一个多音字的词库,存入在dict/polymorphic.dict;示例文件是php-example/test_poly.php:

<?php
include "./Zh2pyPoly.php";
$z2p = new Zh2pyPoly("../dict/polymorphic.dict","../dict/gbk.dict");
print_r($z2p->getPinyin("我们都是**人.我有一匹黄骠马.我屏息屏气.一页扁舟来."));

注意,如果运行php的时候拼音结果出不来,请注意查看php文件编码是否是GBK;