本人本科毕业设计的一部分,准确率不错,性能还在优化中。对数据集运用了一系列完整的流程进行数据挖掘,同时也提出了一种热点聚类算法,并对结果进行可视化分析。 本文的流程与算法具有通用性,可以运用到大多数类似数据的挖掘上。对数据进行预处理,数据清洗,文档转换,中文分词,文档去重等工作。
zuole/BigDataMining
本人本科毕业设计的一部分,准确率不错,性能还在优化中。对数据集运用了一系列完整的流程进行数据挖掘,同时也提出了一种热点聚类算法,并对结果进行可视化分析。 本文的流程与算法具有通用性,可以运用到大多数类似数据的挖掘上。对数据进行预处理,数据清洗,文档转换,中文分词,文档去重等工作。