Open Chinese Convert (OpenCC, 開放中文轉換) is an opensource project for conversion between Traditional Chinese and Simplified Chinese, supporting character-level conversion, phrase-level conversion, variant conversion and regional idioms among Mainland China, Taiwan and Hong kong.
中文簡繁轉換開源項目,支持詞彙級別的轉換、異體字轉換和地區習慣用詞轉換(中國大陸、臺灣、香港)。
- 嚴格區分「一簡對多繁」和「一簡對多異」。
- 完全兼容異體字,可以實現動態替換。
- 嚴格審校一簡對多繁詞條,原則爲「能分則不合」。
- 支持中國大陸、臺灣、香港異體字和地區習慣用詞轉換,如「裏」「裡」、「鼠標」「滑鼠」。
- 詞庫和函數庫完全分離,可以自由修改、導入、擴展。
- 支持C、C++、Python、PHP、Java、Ruby、Node.js。
- 兼容Windows、Linux、Mac平臺。
- Introduction 詳細介紹 https://github.com/BYVoid/OpenCC/wiki/%E7%B7%A3%E7%94%B1
- OpenCC Online (在線轉換) http://opencc.byvoid.com/
- 現代漢語常用簡繁一對多字義辨析表 http://ytenx.org/byohlyuk/KienxPyan
https://bintray.com/byvoid/opencc/OpenCC
opencc --help
s2t.json
Simplified Chinese to Traditional Chinese 簡體到繁體t2s.json
Traditional Chinese to Simplified Chinese 繁體到簡體s2tw.json
Simplified Chinese to Traditional Chinese (Taiwan Standard) 簡體到臺灣正體tw2s.json
Traditional Chinese (Taiwan Standard) to Simplified Chinese 臺灣正體到簡體s2hk.json
Simplified Chinese to Traditional Chinese (Hong Kong Standard) 簡體到香港繁體(香港小學學習字詞表標準)hk2s.json
Traditional Chinese (Hong Kong Standard) to Simplified Chinese 香港繁體(香港小學學習字詞表標準)到簡體s2twp.json
Simplified Chinese to Traditional Chinese (Taiwan Standard) with Taiwanese idiom 簡體到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙tw2sp.json
Traditional Chinese (Taiwan Standard) to Simplified Chinese with Mainland Chinese idiom 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙
Linux/OSX (gcc 4.6 or clang 3.2 is required):
make
sudo make install
Windows MSYS:
cmake .. -G "MSYS Makefiles" -DCMAKE_INSTALL_PREFIX="" -DCMAKE_BUILD_TYPE=Release
make
Windows Visual Studio (2013 or higher required):
cmake .. -G "Visual Studio 12" -DCMAKE_INSTALL_PREFIX="" -DCMAKE_BUILD_TYPE=Release
make
Java API 現在處於實驗階段,穩定性和速度均有待測試。使用前請三思。 Java API 使用JNA,利用opencc的c api來進行包裝。
####編譯及安裝 (需要sbt 0.13.+ and JRE 7+)
cd ./java
sbt package
在maven項目使用,請輸入
sbt publishM2
在sbt項目中使用,則輸入
sbt publishLocal
####項目文件配置
在你的build.sbt中加入
libraryDependencies ++= "opencc-java" % "opencc-java" % "0.0.1"
#####maven項目 在你的POMS裡加入
<dependency>
<groupId>opencc-java</groupId>
<artifactId>opencc-java</artifactId>
<version>0.0.1</version>
</dependency>
####不使用任何Build System
將編譯好旳jar及jna-4.1.0加入到你的ClassPath即可,編譯好的jar在./java/out內。
####使用簡例 使用前請先確定已經安裝好opencc的庫文件。
#####Scala
import opencc.OpenCCConverter
object Main {
def main(args: Array[String]) {
val converter = new OpenCCConverter("s2t.json")
val out = converter.convert("正簡轉換在scala。")
println(out)
}
}
####Java
import opencc.OpenCCConverter
public class OpenCCTester {
public static void main(String[] args) {
OpenCCConverter c = new OpenCCConverter("s2t.json");
System.out.println(c.convert("正簡轉換在Java。"));
c.close();
}
}
Apache License 2.0
- darts-clone BSD License
- tclap MIT License
- rapidjson MIT License
- jna LGPL License
All these libraries except jna are statically linked.