/Demo_TFIDF_Simhash_Python

python3 利用用TF特征向量和Simhash指纹计算中文文本的相似度的示例

Primary LanguagePython

1、Python语言的应用 之 Demo_TFIDF_Simhash_Python

python3 利用TF特征向量和sim hash指纹计算中文文本的相似度的示例

2、更新信息

开发者:沙振宇(沙师弟专栏)
创建时间:2018-12-25
最后一次更新时间:2019-12-13

CSDN博客地址——Python开发 之 利用TF特征向量和Simhash指纹计算中文文本的相似度的示例:
https://shazhenyu.blog.csdn.net/article/details/103522732

3、过程

  • 准备测试数据
  • 预处理读到的数据
  • 加载数据到Map中
  • 输入用户问题
  • 利用TF特征向量和Simhash指纹计算出 预处理的配置文件中的分值

4、预先安装包

此项目需要先安装 jieba

5、效果图

image