/PM.SimLab-AML

Lab code of course Applied Machine Learning. (Source code from ML in Action) 武汉大学信管本科课程《应用机器学习(实验)》我的实验记录代码

Primary LanguageJupyter NotebookMIT LicenseMIT

PM.Simlab-AML

课程《应用机器学习(实验)》的所有代码。记录本人实验过程。

“教材”:《机器学习实战》

欢迎参考,代码存在诸多不足,敬请指正,侵删。欢迎star、fork。

Lab1 数据预处理 & KNN

L1-DataProcessing_KNN.ipynb

  • 练习使用numpy,pandas进行糖尿病数据集和手写数字图像读取和常规操作;
  • 练习使用matplotlib对糖尿病数据样本画出散点图
  • 修改教材kNN程序,实现糖尿病和手写数字图像数据集的kNN分类
  • 使用scikit-learn工具包,实现糖尿病和手写数字图像数据集的kNN分类

Lab2 决策树

L2-Decision_Tree.ipynb 提交版

  • 根据理论课给出的决策树框架修改课程中的决策树程序代码。
  • 进一步修改代码实现CART决策树程序。
  • 使用Titanic数据集,应用留出法、交叉验证法,用上述两种决策树程序进行训练和验证;
  • 使用scikit-learn工具包,实现Titanic数据集的决策树分类,并尝试进行优化。

Lab3 朴素贝叶斯

L3-NaiveBayes.ipynb

  • 学习教材4.6、4.7节内容,调试运行相关代码。
  • 查阅scikit-learn工具包中朴素贝叶斯分类器的相关说明,了解分类器函数使用方法。
  • 完成作业一(朴素贝叶斯预测电脑购买)

Lab4 支持向量机

L4-Support_Vector_Machine.ipynb

  • 学习教材6.3、6.4节内容,调试运行相关代码。
  • 查阅scikit-learn工具包中支持向量机的相关说明,了解分类器函数使用方法。
  • 完成作业二(统计学习方法7.2)

Lab5 回归

L5-Regression.ipynb

  • 复习教材第8、9章内容,调试运行相关代码。
  • 查阅scikit-learn工具包中回归学习器的相关说明,了解相关函数使用方法。
  • 对波士顿房价数据集进行回归分析。

Lab6 逻辑斯蒂回归

L6-LogisticRegression.ipynb 提交版

  • 复习教材第5章内容,调试运行相关代码。
  • 基于教材随机梯度上升算法实现小批量随机梯度上升算法,以疝气病马数据集进行训练和测试,并与教材中的算法进行比较。
  • 查阅scikit-learn工具包中Logistic回归学习器的相关说明,了解相关函数使用方法。

Lab7 集成学习

L7-EnsembleLearning.ipynb

  • 复习教材第七章内容,调试运行相关代码
  • 查阅scikit-learn工具包中Adaboost和其他提升方法学习器的相关说明,了解相关函数使用方法。
  • 完成作业三

Lab8-9 神经网络

L8-NeuralNetwork.ipynb 提交版

  • 查阅scikit-learn工具包中前馈神经网络学习器的相关说明,了解相关函数使用方法。
  • 基于NumPy设计一个包含输入层、隐含层和多分类输出层的前馈神经网络,并以此为基础对手写数字图像进行分类实验。

Lab10 综合考核

adult数据集分类实验。

参考脚本