/spark_data_mining

spark tutorial for big data mining。包括app流量运营分析、als推荐、smote样本采样、RFM客户价值分群、AHP层次分析客户价值得分、手机定位数据商圈挖掘、马尔可夫智能邮件预测、关联规则、推荐电影好友等。

Primary LanguageJava

This repository provides tutorial code for big data mining to learn spark. 本库利用java spark实现的数据挖掘项目,包括一些数据的常规分析与挖掘,也包括了一些机器学习算法。这些项目都可以直接运行在所指定的数据集上。未来如果看到有好的数据挖掘项目或者有自己不错的想法都会随时更新实现。


##Contents

1. basics

2. intermediate

requirements

  • [java1.8]
  • [spark3.0]
  • [python3.6]
  • [pandas1.1.4]
  • [numpy1.18.5]

references