/ChinTextHelper

Primary LanguageC++Apache License 2.0Apache-2.0

Todo List

TextPreprocess

  • 繁体简体转换

  • 字母变形映射

  • 数字变形映射

  • 特殊字符映射

  • 表情包表情符处理

  • 长句切分

PhraseMining

  • ToPMine

unittest

python -m pytest tests