Play-with-Machine-Learning-Algorithms: A Jupyter Notebook repository from yxf006

Python3 入门机器学习 - 课程官方代码仓

大家好，欢迎大家来到我在慕课网上的实战课程《Python3 入门机器学习》的官方代码仓。这个代码仓将不仅仅包含课程的所有源代码，还将发布课程的更新相关内容，勘误信息以及计划的更多可以丰富课程的内容，如更多分享，更多练习，等等等等。大家可以下载、运行、测试、修改。如果你发现了任何bug，或者对课程中的任何内容有意见或建议，欢迎和我联系：）

个人网站：liuyubobobo.com [废弃重整中...]

电子邮件：liuyubobobo@gmail.com

微博: 刘宇波bobo http://weibo.com/liuyubobobo

知乎: 刘宇波 http://www.zhihu.com/people/liuyubobobo

知乎专栏：是不是很酷 https://zhuanlan.zhihu.com/liuyubobobo

个人公众号：是不是很酷：）

推荐一下这门课程的同学 @howie6879 倾情为大家制作的机器学习资源导航检索站：mlhub123，欢迎大家围观使用支持：）传送门：https://www.mlhub123.com/ 大家有更多机器学习领域的开源资源，也可以在这个项目的github页面：howie6879/mlhub123 提issue，给这个项目做贡献：）

课程源码目录

第一章欢迎来到 Python3 玩转机器学习	章节文件夹	-
1-1 什么是机器学习	-	-
1-2 课程涵盖的内容和理念	-	-
1-3 课程所使用的主要技术栈	-	-
第二章机器学习基础	章节文件夹	-
2-1 机器学习世界的数据	-	-
2-2 机器学习的主要任务	-	-
2-3 监督学习，非监督学习，半监督学习和增强学习	-	-
2-4 批量学习，在线学习，参数学习和非参数学习	-	-
2-5 和机器学习相关的“哲学”思考	-	-
2-6 课程使用环境搭建	notebook	script
第三章 Jupyter Notebook, Numpy和Matplotlib	章节文件夹	-
3-1 Jupyter Notebook基础	notebook	-
3-2 Jupyter Notebook中的魔法命令	notebook	script
3-3 Numpy数据基础	notebook	-
3-4 创建Numpy数组(和矩阵)	notebook	-
3-5 Numpy数组(和矩阵)的基本操作	notebook	-
3-6 Numpy数组(和矩阵)的合并与分割	notebook	-
3-7 Numpy中的矩阵运算	notebook	-
3-8 Numpy中的聚合运算	notebook	-
3-9 Numpy中的arg运算	notebook	-
3-10 Numpy中的比较和Fancy Indexing	notebook	-
3-11 Matplotlib数据可视化基础	notebook	-
3-12 数据加载和简单的数据探索	notebook	-
补充代码1: 更多Numpy的操作	notebook	-
补充代码2: Numpy中的结构数组	notebook	-
补充代码3: 简单的MNIST数据集数据探索	notebook	-
第四章最基础的分类算法-k近邻算法 kNN	章节文件夹	-
4-1 k近邻算法基础	notebook	-
4-2 scikit-learn中的机器学习算法封装	notebook	script
4-3 训练数据集，测试数据集	notebook	playML
4-4 分类准确度	notebook	playML
4-5 超参数	notebook	-
4-6 网格搜索与k近邻算法中更多超参数	notebook	-
4-7 数据归一化	notebook	-
4-8 scikit-learn中的Scaler	notebook	playML
4-9 更多有关k近邻算法的思考	-	-
补充代码1: scikit-learn中的其他scaler	[整理中]	[敬请期待]
补充代码2: 网格搜索kNN中的不同距离定义	[整理中]	[敬请期待]
补充代码3: 使用我们自己的kNN算法处理手写数字识别问题	notebook	playML
补充代码4: 使用我们自己的kNN算法处理MNIST手写识别数据集	notebook	playML
第五章线性回归法	章节文件夹
5-1 简单线性回归	-	-
5-2 最小二乘法	-	-
5-3 简单线性回归的实现	notebook	playML
5-4 向量化	notebook	playML
5-5 衡量线性回归法的指标：MSE，RMSE和MAE	notebook	playML
5-6 最好的衡量线性回归法的指标：R Squared	notebook	playML
5-7 多元线性回归和正规方程解	-	-
5-8 实现多元线性回归	notebook	playML
5-9 使用scikit-learn解决回归问题	notebook	playML
5-10 线性回归的可解释性和更多思考	notebook	-
补充代码1: 分类变量的处理	[整理中]	[敬请期待]
补充代码2: scikit-learn中同时处理数字变量和分类变量	[整理中]	[敬请期待]
补充代码3: FeatureUnion的使用	[整理中]	[敬请期待]
第六章梯度下降法	章节文件夹	-
6-1 什么是梯度下降法	-	-
6-2 模拟实现梯度下降法	notebook	-
6-3 线性回归中的梯度下降法	-	-
6-4 实现线性回归中的梯度下降法	notebook	playML
6-5 梯度下降法的向量化和数据标准化	notebook	playML
6-6 随机梯度下降法	notebook	-
6-7 scikit-learn中的随机梯度下降法	notebook	playML
6-8 如何确定梯度计算的准确性？调试梯度下降法	notebook	-
6-9 有关梯度下降法的更多深入讨论	-	-
补充代码1: 实现小批量梯度下降法	[整理中]	[敬请期待]
补充代码2: 三种梯度下降法的可视化比较	[整理中]	[敬请期待]
第七章 PCA与梯度上升法	章节文件夹	-
7-1 什么是PCA	-	-
7-2 使用梯度上升法求解PCA问题	-	-
7-3 求数据的主成分	notebook	-
7-4 求数据的前n个主成分	notebook	-
7-5 高维数据映射为低维数据	notebook	playML
7-6 scikit-learn中的PCA	notebook	-
7-7 试手MNIST数据集	notebook	-
7-8 使用PCA对数据进行降噪	notebook	-
7-9 人脸识别与特征脸	notebook	-
补充代码1: 可视化三维数据的PCA过程	notebook	-
补充代码2: IPCA	[整理中]	[敬请期待]
补充代码3: 随机化PCA	[整理中]	[敬请期待]
补充代码4: Kernel PCA	[整理中]	[敬请期待]
补充代码5: LLE	[整理中]	[敬请期待]
补充代码6: 更多降维方法	[整理中]	[敬请期待]
第八章多项式回归与模型泛化	章节文件夹	-
8-1 什么是多项式回归	notebook	-
8-2 scikit-learn中的多项式回归与Pipeline	notebook	-
8-3 过拟合与欠拟合	notebook	-
8-4 为什么要有训练数据集与测试数据集	notebook	-
8-5 学习曲线	notebook	-
8-6 验证数据集与交叉验证	notebook	-
8-7 偏差方差平衡	-	-
8-8 模型泛化与岭回归	notebook	-
8-9 LASSO	notebook	-
8-10 L1, L2和弹性网络	-	-
补充代码1: scikit-learn中的学习曲线	[整理中]	[敬请期待]
补充代码2: 更多scikit-learn中的交叉验证	[整理中]	[敬请期待]
补充代码3: scikit-learn中的Elastic Net	[整理中]	[敬请期待]
第九章逻辑回归	章节文件夹	-
9-1 什么是逻辑回归	notebook	-
9-2 逻辑回归的损失函数	-	-
9-3 逻辑回归损失函数的梯度	-	-
9-4 实现逻辑回归算法	notebook	playML
9-5 决策边界	notebook	playML
9-6 在逻辑回归中使用多项式特征	notebook	playML
9-7 scikit-learn中的逻辑回归	notebook	-
9-8 OvR与OvO	notebook	-
补充代码1: kNN的决策边界	notebook	-
补充代码2: scikit-learn中的LogisticRegressionCV	notebook	-
补充代码3: 使用 LogisticRegression 处理 MNIST 数据集	notebook	-
补充代码4: scikit-learn中随机梯度下降法训练逻辑回归	[整理中]	[敬请期待]
第十章分类算法的评价	章节文件夹	-
10-1 准确度的陷阱和混淆矩阵	-	-
10-2 精准率和召回率	-	-
10-3 实现混淆矩阵，精准率和召回率	notebook	-
10-4 F1 Score	notebook	-
10-5 精准率和召回率的平衡	notebook	-
10-6 精准率-召回率曲线	notebook	-
10-7 ROC曲线	notebook	playML
10-8 多分类问题中的混淆矩阵	notebook	-
补充代码1: Precision-Recall曲线的面积	[整理中]	[敬请期待]
补充代码2: 多分类问题下的各项指标	[整理中]	[敬请期待]
第十一章支撑向量机SVM	章节文件夹	-
11-1 什么是SVM	-	-
11-2 SVM背后的最优化问题	-	-
11-3 Soft Margin SVM	-	-
11-4 scikit-learn中的SVM	notebook	-
11-5 SVM中使用多项式特征和核函数	notebook	-
11-6 到底什么是核函数	-	-
11-7 什么是RBF核	notebook	-
11-8 scikit-learn中使用RBF核	notebook	-
11-9 SVM**解决回归问题	notebook	-
补充代码1: SVR调参解决波士顿房价问题	[整理中]	[敬请期待]
补充代码2: 更多SVM核函数	[整理中]	[敬请期待]
补充代码3: 手撕LinearSVC	[整理中]	[敬请期待]
补充代码4: 在PCA中使用Kernel——Kernel PCA	[整理中]	[敬请期待]
第十二章决策树	章节文件夹	-
12-1 什么是决策树	notebook	-
12-2 信息熵	notebook	-
12-3 使用信息熵寻找最优划分	notebook	-
12-4 基尼系数	notebook	-
12-5 CART与决策树中的超参数	notebook	-
12-6 决策树解决回归问题	notebook	-
12-7 决策树的局限性	notebook	-
补充代码1: 决策树看学习曲线	notebook	-
补充代码2: 决策树看复杂度曲线	notebook	-
补充代码3: 决策树调参解决波士顿房价问题	[整理中]	[敬请期待]
补充代码4: 手撕决策树	[整理中]	[敬请期待]
第十三章集成学习和随机森林	章节文件夹	-
13-1 什么是集成学习	notebook	-
13-2 Soft Voting Classifier	notebook	-
13-3 Bagging 和 Pasting	notebook	-
13-4 oob (Out-of-Bag) 和关于Bagging的更多讨论	notebook	-
13-5 随机森林和 Extra-Trees	notebook	-
13-6 Ada Boosting 和 Gradient Boosting	notebook	-
13-7 Stacking	-	-
补充代码1: 使用随机森林判断特征重要程度	[整理中]	[敬请期待]
补充代码2: 调参使用Bagging	[整理中]	[敬请期待]
补充代码3: 调参使用RandomForests	[整理中]	[敬请期待]
补充代码4: 调参使用Extra-Trees	[整理中]	[敬请期待]
补充代码5: 调参使用AdaBoost	[整理中]	[敬请期待]
补充代码6: 调参使用Gradient Boosting	[整理中]	[敬请期待]
补充代码7: 手撕Stacking	[整理中]	[敬请期待]
第十四章结语，大家加油！	-	-
14-1 学习scikit-learn文档, 大家加油！	-	-

课程讲义的PDF版本不在github上提供，大家可以在慕课网上 "下载 -> 查看讲师源码" 中各个章节文件夹下找到。

大家加油！：）

yxf006/Play-with-Machine-Learning-Algorithms

Python3 入门机器学习 - 课程官方代码仓

课程源码目录