基础内容框架源自:microsoft/ai-edu(个人非常推荐的一套教程)
What I cannot create, I do not understand.
如果我不能亲手搭建起来一个东西,那么我就不能理解它。 -- 美国物理学家理查德·费曼
| 符号 | 含义 |
|---|---|
| 训练用样本值 | |
| 第一个样本或样本的第一个特征值,在上下文中会有说明 | |
| 第1个样本的第2个特征值 | |
| 训练用多样本矩阵 | |
| 训练用样本标签值 | |
| 第一个样本的标签值 | |
| 训练用多样本标签矩阵 | |
| 线性运算的结果值 | |
| 线性运算的结果矩阵 | |
| 第一层网络的线性运算结果矩阵 | |
| 激活函数 | |
| 激活函数结果值 | |
| 激活函数结果矩阵 | |
| 第一层网络的激活函数结果矩阵 | |
| w | 权重参数值 |
| 权重参数矩阵中的第1行第2列的权重值 | |
| 第一层网络的权重参数矩阵中的第1行第2列的权重值 | |
| 权重参数矩阵 | |
| 第一层网络的权重参数矩阵 | |
| 偏移参数值 | |
| 偏移参数矩阵中的第1个偏移值 | |
| 第二层网络的偏移参数矩阵中的第1个偏移值 | |
| 偏移参数矩阵(向量) | |
| 第一层网络的偏移参数矩阵(向量) | |
| X的转置矩阵 | |
| X的逆矩阵 | |
| 单样本误差函数 | |
| 多样本损失函数 |
在后面的讲解中,我们一般会使用如下方式进行:
- 提出问题:先提出一个与现实相关的假想问题,为了由浅入深,这些问题并不复杂,是实际的工程问题的简化版本。
- 解决方案:用神经网络的知识解决这些问题,从最简单的模型开始,一步步到复杂的模型。
- 原理分析:使用基本的物理学概念或者数学工具,理解神经网络的工作方式。
- 可视化理解:可视化是学习新知识的重要手段,由于我们使用了简单案例,因此可以很方便地可视化。
