/Data-Mining

code implements of <<Statistical learning methods>>

Primary LanguagePython

#目的: 机器学习大作业

参考书:

  1. <<统计学习方法>>
  2. <<机器学习实战>>
  3. <<西瓜书>>

###实现方式:
原计划以<统计学习方法>为理论,<机器学习实战>为代码参考.
在实现途中,发现<机器学习实战>的代码比较啰嗦,很多操作使用pandas,更简介和直观.
所以大部分基于自己理解去写的.
写的时候感觉实现了挺多,一总结发现也没实现多少算法,哎~_~

####原打算实现的算法: 回归

  • 最小二乘回归
  • 岭回归
  • LASSO回归

分类

  • 朴素贝叶斯
  • 逻辑回归
  • SVM(仅有CVXPY版,没有SMO版)


  • ID3决策树
  • CART回归树
  • CART模型树

Boosting 和 Bagging

  • AdaBoost
  • GBDT

降维

  • PCA
  • SVD

聚类

  • K-means

推荐

  • Slope One
  • 协同过滤

加上中途老师布置的数据挖掘作业,一共就这些了,总耗时差不多2个多星期.