本项目对spark ml
包中各种算法的原理加以介绍并且对算法的代码实现进行详细分析,旨在加深自己对机器学习算法的理解,熟悉这些算法的分布式实现方式。
- spark1.6
本系列目录如下:
- 协同过滤
- 分类和回归
- 线性支持向量机
- 逻辑回归
- 朴素贝叶斯
- 决策树
- 随机森林
- 保序回归
- 聚类
- 最优化算法
- 梯度下降算法
- L-BFGS
- NNLS(非负最小二乘)
- 降维
- 奇异值分解(SVD)
- 主成分分析(PCA)
- 特征抽取和转换
- TF-IDF
- Word2Vec
- StandardScaler
- Normalizer
- ChiSqSelector
- ElementwiseProduct
本文使用的许可见 LICENSE