geolonia/normalize-japanese-addresses

「崎」「﨑」の表記揺れ

mikihiro-t opened this issue · 1 comments

「崎」「﨑」は、どちらも同じ字なので、本来どちらを利用しても良いらしいです。
https://sumisalon.com/saki/
https://ja.wiktionary.org/wiki/%E5%B4%8E

latest.csvの住所データでよく利用されているのは「崎」ですが、
「﨑」も1つあります。「奈良県宇陀市菟田野岩﨑」
https://www.city.uda.nara.jp/soumu/kurashi/sumai/juusho/utano.html

■表記揺れの例
ひたちなか市磯「崎」町が通常使われていますが、

下記の学校コードの住所では、
茨城県ひたちなか市磯「﨑」町5135
https://www.mext.go.jp/b_menu/toukei/mext_01087.html
が使われました。

以上をふまえて、
dict.tsの、toRegexPattern で処理すると良いように思えますが、どうでしょうか。

@mikihiro-t こちらの対応が遅れて大変申し訳ありません!
v3リリースと共に追加しておきました。こちらで確認できます:

報告ありがとうございました!