/sinetym

Comparative analysis toolset for Chinese dialects

Primary LanguagePython

sinetym

The name sinetym stands for Sino-etymology, that is a small toolset for comparing Chinese dialects.

这是一个自动化处理汉语方言读音数据的工具,用来方便方言读音数据的清洗、对比以及辅助祖语重构。方言读音数据来自小学堂的汉字古今音资料库。该库是我能找到的收录最多的方言字音库,数据来源是从各种已发表的方言调查资料录入。这里提供了一个爬虫用于定向爬取该库数据,以便于批量处理。