- 非结构化数据分析期末课程报告
- 提取最大连通组件
- 社交网络描述统计:度分布、节点中心性、边介数、凝聚性特征
- 社区发现:Edge-Betweenness、Fast Greedy、Multi Level、Walk Trap
- 单个用户的 facebook网络数据的描述统计分析
- 合并后的facebook网络数据的描述统计分析
- 基于相似度算法的指标比较:局域、全域、准局域
-
- 随机生成数据流
DSD_Gaussians
、数据流写入文件write_stream
、导入文件形成数据流DSD_Memory
- 数据流聚类算法
DSC_BIRCH
、DSC_Hierarchical
- 聚类评价:
evaluate
、evaluate_cluster
- 随机生成数据流
-
- spark的详细安装过程
- 文本分类
-
垃圾短信数据集下载地址:
链接:https://pan.baidu.com/s/18OpmP9F2Ef5rHqMI7QEp2A 提取码: f69z