/Lecture-notes-for-Machine-Learning

Lecture notes for Machine Learning (机器学习讲义)

Primary LanguageJupyter NotebookMIT LicenseMIT

Lecture notes for Machine Learning (机器学习讲义)

Python 3.5

主要内容

  • Chapter1 基础知识(79 Pages)

    • 模型、策略和算法;
    • 实例:多项式曲线拟合;
      • 正则项的意义;
      • 测试数据集与验证数据集的引入;
    • 模型学习的概率解释;
      • 概率学派与贝叶斯学派;
      • 最大似然估计与最大后验估计的引入;
      • 高斯分布及其性质;
      • 基于高斯分布的似然函数及最大化;
      • 最大似然方法的局限性;
      • 多项式曲线拟合问题的概率解释;
      • 多项式曲线拟合问题的改进;
      • 贝叶斯曲线拟合;
    • 附录;
      • 概率论基础知识;
      • 矩阵与向量;
      • 特征值与奇异值分解;
      • 梯度下降法;
      • 牛顿法与拟牛顿法;
      • 拉格朗日乘数法;
    • 实验:最小二乘法之直线拟合与多项式拟合,Source Code
  • Chapter2 判别函数的线性分类基础(47 Pages)

    • 二分类与多分类基础;
    • 基本判别函数;
      • 最小平方分类方法;
      • Fisher二分类方法;
      • 最小平方分类方法与Fisher分类方法;
      • Fisher多分类方法;
      • 感知机;
    • 附录;
      • 标量函数对矩阵的求导;
    • 实验:感知机,Source CodeResult(Video)
  • Chapter3 K近邻(20 Pages)

    • kNN模型;
      • 距离度量;
      • k值;
      • 决策规则;
    • kd树;
      • kd树的生成;
      • kd树的搜索;
    • 实验:Source Code
  • Chapter4 决策树(47 Pages)

    • 分类决策树;
      • 信息论基础:自信息、信息熵、条件熵、联合熵、互信息、相对熵、交叉熵;
      • 特征选择;
      • 决策树的生成:ID3与C4.5算法;
      • 剪枝算法;
    • 分类回归树(CART算法)
      • 回归树的生成;
      • 分类树的生成;
      • 剪枝算法;
    • 实验:Source Code
  • Chapter5 朴素贝叶斯(17 Pages)

    • 分类模型;
    • 类别推理的依据——期望风险最小化;
    • 参数估计;
    • 学习算法;
    • 实验:Source Code
  • Chapter6 逻辑回归(36 Pages)

    • 从线性回归到二分类逻辑回归:Sigmoid函数;
    • 二分类模型的似然函数与损失函数;
    • 二分类模型中梯度的计算;
    • 代理损失函数;
    • Logistic分布;
    • Sigmoid函数与Tanh函数;
    • 对数几率与线性决策面;
    • 从二分类到多分类:Sigmoid与Softmax函数;
    • 多分类模型的似然函数与损失函数;
    • 多分类模型中梯度的计算;
    • 神经网络的视角;
    • 广义线性模型与指数族分布;
    • 逻辑回归与高斯朴素贝叶斯;
    • 实验:Source CodeResult(Video)
  • Chapter7 最大熵模型(29 Pages)

    • 最大熵原理;
    • 最大熵模型;
      • 条件熵;
      • 模型的定义与推导;
      • 梯度下降法;
      • 改进的迭代尺度法(IIS);
      • 拟牛顿法;
    • 最大熵模型与逻辑回归;
    • 实验:Source Code
  • Chapter8 支持向量机(61 Pages)

    • 线性可分支持向量机;
      • 几何间隔与函数间隔;
      • 学习策略:硬间隔最大化;
      • 最优分离超平面的存在性与唯一性;
      • 原始学习算法的求解实例;
      • 学习的对偶算法;
      • 对偶算法的求解实例;
    • 一般线性支持向量机;
      • 学习策略:软间隔最大化;
      • 学习的对偶算法;
      • 合页损失函数的视角;
    • 非线性支持向量机;
    • SMO算法;
      • 解析法:求解2变量二次规划子问题;
      • 启发式:2变量的选择方法;
      • E与b值的更新;
    • 实验:Source CodeResult(Video)
  • Chapter9 提升方法(32 Pages)

    • AdaBoost模型;
      • 加法模型与前向分步算法;
      • AdaBoost模型的推导;
      • AdaBoost算法;
      • 算法示例;
      • 训练误差分析;
    • 回归提升树;
      • 回归提升树算法;
      • 算法示例;
    • 梯度提升树
    • 实验:Source Code
  • Chapter10 EM算法(32 Pages)

    • EM算法的引入;
    • 通用EM算法;
    • EM算法的收敛性;
    • 朴素贝叶斯的EM算法;
    • 高斯混合模型的EM算法;
    • EM算法与F函数;
    • 实验:Source CodeResult(Video)
  • Chapter11 HMM模型(28 Pages)

    • 概率计算:前向算法、后向算法及其它概率的计算;
    • 预测算法:贪心算法、Viterbi算法;
    • 学习算法:监督学习与Baum-Welch算法(EM算法);
    • 实验:Source Code
  • Chapter12 线性链条件随机场(67 Pages)

    • 概率图模型:有向图与无向图模型;
    • 线性链条件随机场:基本形式、简化形式与矩阵形式;
    • 概率计算:前向-后向算法、常见概率的计算、特征函数期望值的计算;
    • 预测算法:贪心算法与Viterbi算法;
    • 学习算法;
      • 改进的迭代尺度法(IIS);
      • 拟牛顿法;
    • 实验:Source Code