/Cangjie3-Plus

倉頡三代補完計畫

Primary LanguagePythonMIT LicenseMIT

Cangjie3-Plus

简化字版说明

倉頡三代補完計畫,和 Cangjie5 相關。

由「倉頡平台2012」的「五倉世紀」碼表修改而來。

下載

點擊此處下載適用於Rime的方案文件。

點擊此處下載適用於替換微軟倉頡碼表的文件。(使用說明見此處

緣由

市面上如今已經有許多倉頡三代的碼表,為何還要費心力開展「倉頡三代補完計畫」?這張碼表有什麼獨特之處?

倉頡三代之前有的許多碼表中往往存在以下問題:其一,取碼存在混亂的情況,許多非Big-5漢字的取碼,包括簡體字有大量錯碼,而Big-5部分的漢字,由於歷史原因也存在一些奇怪的取碼。其二,對大陸字形不友好,很多簡體字以大陸字形取碼打不出來,導致了倉頡三代背上了「無法打簡」、「規則不適合打簡」的罵名。但實際上倉頡三代與倉頡五代的輔助字形差異很小,完全可以用來拆解簡體字。其三,對官方規則有較大的改動,以官方規則及輔助字形對漢字取碼後打不出來字。其四,長時間未有更新,在字集上遠遠落後,又或是掛羊頭賣狗肉,擴充字集中的編碼實為五代編碼,又或者是有缺字現象。

作為一個由三代入門的用戶,自然無法忍受這種狀況,因此我便從2017年開始,開展了「倉頡三代補完計畫」。

目標

  1. 本計畫:
    1. 【有意】參考大量官方資料,逐個審閱漢字的倉頡編碼,使編碼貼近官方資料。
    2. 【有意】擴充原碼表,使其在字集上不會落後。
    3. 【有意】完善字形兼容,使其對舊字形、大陸字形、台灣字形、香港字形、日本字形等有一定的兼容。
    4. 考慮到重碼問題,【並不會】完全兼容舊字形、大陸字形、台灣字形、香港字形及日本字形。
    5. 【有意】結合官方資料和個人的理解製作一份碼表,擴大用戶的選擇面。
    6. 【並不打算】對官方取碼中被視作是不符合倉頡輸入法規則的部分提出修改或解釋。
    7. 【不可能】也【無意】滿足所有人的需求。
  2. 官方資料包括以下內容:
    1. 《零壹中文電腦叢書之八 倉頡第三代中文字母輸入法》(1984,全華)
    2. 《零壹中文電腦叢書之九 增訂版倉頡第三代中文輸入法》(1991,全華)
    3. 《第五代倉頡輸入法手冊》(1993,松崗、1999,文化傳信、2006,博碩)
    4. 《零壹中文電腦叢書之七 標準倉頡第二代中文輸入法》(1983,全華)
    5. 《內碼對照表》(朱邦復工作室)
    6. 與沈紅蓮女士通信之信函

内容

  • cj3.txt
    收錄了中日韓統一表意文字基本區至擴展I區的碼表。另還包括了一些符號與漢字兼容區中不存在於基本區的十二個漢字。

  • cj3-30000.txt
    收錄了中日韓統一表意文字基本區至擴展A區的碼表。另還包括了一些符號與漢字兼容區中不存在於基本區的十二個漢字,是cj3.txt的子集。

  • cj3_supplement.txt
    收錄了筆畫、部首、部首增補區、漢字兼容區、兼容區增補中的字符。

  • cj3-special.txt
    收錄了中日韓統一表意文字基本區至擴展A區、HKSCS,以及通用規範漢字表中的漢字,在字集方面,是cj3.txt的子集。另外為了照顧用戶習慣,加入了「捏、撐」被官方強制Big5後的編碼(關於強制Big5化的問題可參考change_summary.md中的說明)。本碼表主要是為了方便輸入法內置而作,在更新上可能落後於cj3.txt與cj3-30000.txt,建議個人使用者選擇前兩張碼表。

  • change_summary.md
    碼表修改總體說明。

  • 編碼修改記錄.xlsx
    詳細記錄了碼表的修改。

FAQ

1.為何是用「五倉世紀」碼表修改而來?

A:如上所言,許多流行的三代碼表有較多的錯碼,又或是對大陸字形不友好,甚至是有許多缺字,修改起來工作量較大。而五倉世紀的錯碼除Ext-C、Ext-D以外相對而言較少,本身對大陸字形也有一定的支持,因此對於五倉世紀已有的字集,我只需將五代編碼改成三代的,並在此基礎上再增添一些舊字形、港台字形、日本字形的字形兼容,再修改其中的錯碼。而這些工作量反而小於直接修改現有的三代碼表。由於是逐行審閱,所以不會有改漏的情況出現。

2.參考資料中為何有二代、五代和六代的資料?

A:我們認為,各代倉頡不是截然對立的,其**是互通的。歷代倉頡有相同的設計目標,許多設計也曾隔代出現,和官方交流後,我們也認識到,〇三五代中許多為罕用字而設的規則或輔助字形在不影響常用字的情況下也可追加到舊版的倉頡之中。 例如,「噩」在二代手冊和84版三代手冊中取「一口口土」,但其在增訂版三代手冊中被改為「一土口口」。93版五代手冊和99版五代手冊之附錄中,「噩」被取碼為「一土口口」,與增訂版三代相同。而在六代中,「噩」取碼「一口口口」。可以看到,六代「噩」字的取碼精神又回到了二代,僅有末碼由於取消了「土」的包含省略功能而有所區別。而三代則經歷過兩種不同的取碼思路。由於目前流行的三代碼表都依從增訂版三代手冊中的取碼方法,故本碼表也會以增訂版三代為基礎。

反饋錯誤

若發現錯誤,可在此處反饋。 另外,也會收集在下方「友情連接」中的地點反饋的錯誤。 非常感謝!

友情連接