infinilabs/analysis-pinyin

中文首字符携带数字排序不理解大小

hxwab opened this issue · 0 comments

hxwab commented

比如中文字符串分别为: 01录制文件 、02录制文件 、10录制文件 、18录制文件、2录制文件、0219录制
拼音分词排序升序为: 01录制文件、02录制文件、0219录制、10录制文件 、18录制文件、2录制文件
可以看出这里是按照首字符排序的,如果包含数字,是否支持按照实际大小来排序