Mozcのvariant_rule.txtを元に、以下の条件を順次適用して作成したものです。
- JIS X 0208範囲外→JIS X 0208の事例を削除 (例: 𠮟→叱(異体字)を削除)
- A→B、B→A両方向の事例が存在する場合は共に削除 (例: 伜→倅(正字)、倅→伜(俗字)を共に削除)
- A→Bの事例に対してB→Cの事例が存在する場合は後者を削除 (例: 体→體(旧字体)と體→軆(俗字)について、後者を削除)
漢字1\t漢字2
漢字1
は、variant_rule.txtにおいて
more popular
と記述がある側の漢字です。
漢字2
が複数存在する場合は/
で連結したものを記述します。
先に示した条件によって除外された事例です。
Copyright 2018 akirakubo
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in compliance with the License.
You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.