对输入input.txt文件进行停用词去除和分词到output.txt文件,通过modelLDA.py文件进行词矩阵并进行主题分割和相似文本的结合,重要难度是在于主题个数的确定以及相似度的确定,这直接影响了最终得到的结果
donttal/LDA_Textsimilarities
对输入input.txt文件进行停用词去除和分词到output.txt文件,通过modelLDA.py文件进行词矩阵并进行主题分割和相似文本的结合,重要难度是在于主题个数的确定以及相似度的确定,这直接影响了最终得到的结果
PythonMIT