/py3-cosine-similiarity

python3余弦相似度算法简单实现

Primary LanguagePythonMIT LicenseMIT

Demo介绍

使用余弦相似度算法计算两个文本的相似度的简单实现

运行环境

Python3

外部库

  1. jieba 中文分词库

概念

将向量根据坐标值,绘制到向量空间中。如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征, 这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。

公式

公式1