1、Python语言的应用 之 Demo_TFIDF_Simhash_Python
python3 利用TF特征向量和sim hash指纹计算中文文本的相似度的示例
2、更新信息
开发者:沙振宇(沙师弟专栏)
创建时间:2018-12-25
最后一次更新时间:2019-12-13
CSDN博客地址——Python开发 之 利用TF特征向量和Simhash指纹计算中文文本的相似度的示例:
https://shazhenyu.blog.csdn.net/article/details/103522732
3、过程
- 准备测试数据
- 预处理读到的数据
- 加载数据到Map中
- 输入用户问题
- 利用TF特征向量和Simhash指纹计算出 预处理的配置文件中的分值
4、预先安装包
此项目需要先安装 jieba