/singlePass

一个简单的singlePass聚类,使用tf-idf向量计算cos相似度来判断是否属于同一个类

Primary LanguagePython

singlePass

一个简单的singlePass聚类(英文),使用tf-idf向量计算cos相似度来判断是否属于同一个类

数据格式如同csv文件中展示的那样,提取content列进行聚类。

其中聚类结果存储在1.txt中

1.txt的数据解释在截图中进行了大致解释。