/chinese-text-clean

中文文本数据清理,去url,去非中文、英文、数字字符,分词,去停用词,去空行(根据文本需求再加自定义清理)

Primary LanguagePython

No issues in this repository yet.