Demo介绍 使用余弦相似度算法计算两个文本的相似度的简单实现 运行环境 Python3 外部库 jieba 中文分词库 概念 将向量根据坐标值,绘制到向量空间中。如最常见的二维空间。求得他们的夹角,并得出夹角对应的余弦值,此余弦值就可以用来表征, 这两个向量的相似性。夹角越小,余弦值越接近于1,它们的方向更加吻合,则越相似。 公式