李家翔,武睿琦,靳晓松 2019-09-25
更新记录见 NEWS
- 比赛: 光伏短期功率预测大赛
- 需求: 短期光伏功率预测
- 项目名称的由来,PHotoVoltaic (phv)
- 国能日新光伏功率预测大赛 官方网址
此次比赛我们的名字最后排在52名。
我们主要的实现方式是
- 神经网络模型,具体见Python代码
wushen.ipynb
。最后成绩是神经网络模型的结果。 - Xgboost的融合,具体见R代码
note.Rmd
使用trelliscope
,交互方便,但是不适合上线部署,不便于交流。
我们尝试的特征工程是
- 加入滞后项
- 加入时间相关变量,见R包
timetk::tk_augment_timeseries_signature
函数 - 加入平方项、立方项,拟合非线性关系
- 加入交互项
- 加入比率
- 加入滚动SMA
- 加入滚动方差
- 加入PCA的主成分
- 加入实发辐射的测试集预测值
- 加入NMF的衍生变量
- 加入 prophet
高亮为测试后效果好的变量。
一系列的特征工程我们在Xgboost进行了融合。
…
- 我们没有将神经网络和XGboost进行融合,因为没有保存训练集的预测值。 主办方在比赛过程中修改了数据集和评价函数,导致我们无法复现原来的历史预测。 这是我们下一次比赛需要注意的问题。
- 其次,我们一开始没有很好的做EDA,观察被解释变量关于时间的波动,查看异常值。
- 在特征工程的部分,非线性关系的拟合,没有使用更高效的 Ramsey’s RESET test,详见Github
- 另外参考 预测值迁移 的问题,有可能存在 欠拟合的情况,目前处理的方式见 模型校正部分 。
Please note that the ‘phv’ project is released with a Contributor Code of Conduct. By contributing to this project, you agree to abide by its terms.