Jackchows/Cangjie5

相容區漢字編錯碼

Closed this issue · 11 comments

綠 vfnve 中日韓兼容表意文字

vfvne

索 jbvf 中日韓兼容表意文字

jbvif

隸 dfle 中日韓兼容表意文字

gfle

類 fdmbc 中日韓兼容表意文字

fkmbc

隆 nlheg 中日韓兼容表意文字

nlhem

免 shau 中日韓兼容表意文字

shahu

嬨 vtvp 中日韓兼容表意文字

vyyp

者 jka 中日韓兼容表意文字

jkia

甆 tvin 中日韓兼容表意文字

yyvin

絛 olhef 中日韓兼容表意文字

olhf

變 yvfw 中日韓兼容表意文字

yvfe

遲 yseq 中日韓兼容表意文字

yseq

唐 ijsr 中日韓兼容表意文字補充

ilr

夆 hqqj 中日韓兼容表意文字補充

heqj

憯 qkua 中日韓兼容表意文字補充

pkua

櫛 dhal 中日韓兼容表意文字補充

dhhl

𣲼 ekbn 中日韓兼容表意文字補充

elbn

祖 mcbm 中日韓兼容表意文字補充

mfbm

𦬼 tof 中日韓兼容表意文字補充

tnf

䘵 lnme 中日韓兼容表意文字補充

lsme

漏字:

﨎	yge
﨏	gcor
﨑	uytr
﨓	dtoi
﨔	dfcq
﨟	tbav
﨡	lihqm
﨣	goyj
﨤	ynhe
﨧	cjkd
﨨	cgtj
﨩	nlhau
郞	ivnl
隷	gfle

⺨ kh 中日韓部首補充

ksh

mrhso commented

「﨎﨏﨑﨓﨔﨟﨡﨣﨤﨧﨨﨩」十二字并非兼容字,谢绝钦定。

那些字元的編碼都是在 CJK Compatibility Ideographs 區段,你說不是兼容字是什麼意思?

mrhso commented

我不知道为什么在兼容区就是「兼容字」,不如你找找其对应的非兼容字看看?
当初这十二个字放入兼容区纯粹是因为 IBM 非日本官方而已。

那要根據什麼定義是不是相容字?

mrhso commented

很明显这十二个字符不能表示成某 Unified 字符的 SVS 形式,从而它们本身是 Unified。

mrhso commented

image
image
image
再者 ISO/IEC 10646 原文就提到了,我的意思很明显了。

你們目前對於相容字有沒有明確的操作型定義?除了這幾個字還有沒有可能有其他相容區的字你們不打算視為相容字?

原文已經寫得很清楚了,「This section contains twelve characters that are CJK unified ideographs」。
不是我們「不打算視為相容字」,而是按照UCS定義,這十二個字就不是兼容字。這十二個字放入兼容區的原因前面已經說了。

"This section" 指的是 "IBM Compatibility ideographs" 那部分吧?我問的是所有相容區的字元中還有沒有其他不是相容字?如果相容區不可靠,有沒有明確的列表能說明誰是相容字誰不是?

mrhso commented

没有。

經比對 ffa3721 並沒有修改 Cangjie5_supplement.txt,裡面如「⺨」、「索」等字的編碼仍是錯的。是否漏掉了?