/OpenCC

A project for conversion between Traditional and Simplified Chinese

Primary LanguageC++Apache License 2.0Apache-2.0

Open Chinese Convert 開放中文轉換

Introduction 介紹

Open Chinese Convert (OpenCC, 開放中文轉換) is an opensource project for conversion between Traditional Chinese and Simplified Chinese, supporting character-level conversion, phrase-level conversion, variant conversion and regional idioms among Mainland China, Taiwan and Hong kong.

中文簡繁轉換開源項目,支持詞彙級別的轉換、異體字轉換和地區習慣用詞轉換(中國大陸、臺灣、香港)。

Features 特點

  • 嚴格區分「一簡對多繁」和「一簡對多異」。
  • 完全兼容異體字,可以實現動態替換。
  • 嚴格審校一簡對多繁詞條,原則爲「能分則不合」。
  • 支持中國大陸、臺灣、香港異體字和地區習慣用詞轉換,如「裏」「裡」、「鼠標」「滑鼠」。
  • 詞庫和函數庫完全分離,可以自由修改、導入、擴展。
  • 支持C、C++、Python、PHP、Java、Ruby、Node.js。
  • 兼容Windows、Linux、Mac平臺。

Links 相關鏈接

Installation 安裝

Download 下載

https://bintray.com/byvoid/opencc/OpenCC

Usage 使用

Command Line 命令行

opencc --help

Configurations 配置文件

預設配置文件

  • s2t.json Simplified Chinese to Traditional Chinese 簡體到繁體
  • t2s.json Traditional Chinese to Simplified Chinese 繁體到簡體
  • s2tw.json Simplified Chinese to Traditional Chinese (Taiwan Standard) 簡體到臺灣正體
  • tw2s.json Traditional Chinese (Taiwan Standard) to Simplified Chinese 臺灣正體到簡體
  • s2hk.json Simplified Chinese to Traditional Chinese (Hong Kong Standard) 簡體到香港繁體(香港小學學習字詞表標準)
  • hk2s.json Traditional Chinese (Hong Kong Standard) to Simplified Chinese 香港繁體(香港小學學習字詞表標準)到簡體
  • s2twp.json Simplified Chinese to Traditional Chinese (Taiwan Standard) with Taiwanese idiom 簡體到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙
  • tw2sp.json Traditional Chinese (Taiwan Standard) to Simplified Chinese with Mainland Chinese idiom 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙

Development Documentation 開發文檔

Build 編譯

Build Status

Build with CMake

Linux/OSX (gcc 4.6 or clang 3.2 is required):

make
sudo make install

Windows MSYS:

cmake .. -G "MSYS Makefiles" -DCMAKE_INSTALL_PREFIX="" -DCMAKE_BUILD_TYPE=Release
make

Windows Visual Studio (2013 or higher required):

cmake .. -G "Visual Studio 12" -DCMAKE_INSTALL_PREFIX="" -DCMAKE_BUILD_TYPE=Release
make

Java Wrapper (實驗階段)

Java API 現在處於實驗階段,穩定性和速度均有待測試。使用前請三思。 Java API 使用JNA,利用opencc的c api來進行包裝。

####編譯及安裝 (需要sbt 0.13.+ and JRE 7+)

cd  ./java
sbt package

在maven項目使用,請輸入

sbt publishM2

在sbt項目中使用,則輸入

sbt publishLocal

####項目文件配置

sbt 項目

在你的build.sbt中加入

libraryDependencies ++=  "opencc-java" % "opencc-java" % "0.0.1"

#####maven項目 在你的POMS裡加入

<dependency>
	<groupId>opencc-java</groupId>
	<artifactId>opencc-java</artifactId>
	<version>0.0.1</version>
</dependency>

####不使用任何Build System

將編譯好旳jar及jna-4.1.0加入到你的ClassPath即可,編譯好的jar在./java/out內。

####使用簡例 使用前請先確定已經安裝好opencc的庫文件。

#####Scala

import opencc.OpenCCConverter
object Main {
    def main(args: Array[String]) {
        val converter = new OpenCCConverter("s2t.json")
        val out = converter.convert("正簡轉換在scala。")
        println(out)
    }
}

####Java

import opencc.OpenCCConverter
public class OpenCCTester {
      public static void main(String[] args) {
          OpenCCConverter c = new OpenCCConverter("s2t.json");
          System.out.println(c.convert("正簡轉換在Java。"));
          c.close();
      }
}

Projects using Opencc 使用OpenCC的項目

License 許可協議

Apache License 2.0

Third Party Library 第三方庫

All these libraries except jna are statically linked.

Contributors 貢獻者