gitHub
欢迎提pull requests, 如果有bug
或新需求
,请反馈issue
unlp是一些经常需要用到的NLP算法包,有助于您学习和使用基于深度学习的文本处理。
python3.6+
pip install unlp
pip install -r requirements.txt
- 根据nlp的任务来构建这个包,主要有无监督学习、有监督学习以及文本增强的一些常有方法;
- 无监督学习中有关键词抽取,向量嵌入和相似度计算;
- 监督学习中有分类任务,命名实体识别,文本生成等;
- 文本增强常用方法,比如回译,同义词替换等。
- 关键词抽取;
- 向量嵌入;
- 相似度计算;
- 语义搜索;
...
- 文本分类;
- 命名实体识别;
- 文本摘要;
- 对话生成;
...
- 回译;
- EDA(同义词替换、插入、交换和删除);
...