test_v1

训练参数如下：
训练过程设置了随机数种子seed为0,为了通过控制变量保证模型准确的评价 config = { 'n_epochs': 3000, # maximum number of epochs 'batch_size': 64, # mini-batch size for dataloader 'optimizer': 'SGD', # optimization algorithm 'optimizer_hparas': { # hyper-parameters for the optimizer 'lr': 0.00065, "weight_decay": 1e-4, # Using for L2 Norm 'momentum': 0.9 }, 'early_stop': 200, # early stopping epochs 'save_path': 'models/model.pth' }
训练过程设计为最大3000次的迭代，随着梯度下降的进行神经网络不断更新，每次参与迭代的数据集batch大小为64. early_stopping只关注test dataset中的loss值。当有连续200次迭代loss值都没有下降可以认为训练已经陷入critical point，停止训练。

由于特征量有6个维度，不一定每个维度的数据都会对模型有很大影响，有的特征量可能只有很小的影响，但是先前方法将所有特征量都涵盖到训练当中（将每个特征量视为等权重训练），这会导致部分无关信息会干扰训练造成模型不准确。采用PCA主成分分析法，通过求解协方差矩阵的特征值和特征向量，选取最大特征值对应的特征向量(6, 6) 我选取了特征向量中前5个维度，删减后相当于一个(5, 6)维度的特征向量乘以(8243, 6)得到新的数据为shape为(8243, 5)
loss 曲线最低值为0.006155287731707711
Predict 曲线

可以看到预测数据和真实数据生成的图像，集中在0.8-0.9之间预测较为准确，但是0-0.7的数据几乎无法预测，我任务这是因为标签值处于0.8-0.9之间的数据量太大，导致训练存在过拟合。先前中间隐藏层为64维，我将其降低为32维得到的模型效果是目前最优的。
均方差 0.07139627942679824, R2 0.41647982597351074

本次数据分析采用全连接神经网络，SGDM，均方误差损失函数和L2正则项。使用均方差（越小越好）和R2（越大越相关，但不是绝对的）评价训练模型的好坏程度。初次训练结束后，模型的均方差为0.079,R2值为0.40,这是一个较为合理的值（可以很好的预测数据，但并不是最优的）
根据7中predict图，大部分数据集中在0.8-0.9之间，部分数据过于离散。这可能是特征量中无关信息干扰所致
采用PCA主成分分析法进行降维。提取了主要信息。可以看出将数据降至4维时，模型到达相对最优解。当继续降维会导致有关特征缺失从而使模型无法更好的得到信息。
BN层和32维度的神经网络证实可以提升模型的表现。

weiyang-jiang/Dieteng_testv1