lanl earthquake prediction submissions文件夹中文件命名方式:submission+梯度最大值+(增长比例,衰减比例)
梯度信息保存在如‘sum1.411.csv’文件中,可后期进行查阅
目前最好成绩 1.411
记录一:统计1.422,1.445,1.472,1.475,1.541等成绩相对于最好成绩的梯度,将呈现正相关的数据按照正相关程度(即各个样本对于成绩的支持度)进行增长,增长比例为正相关程度/1200,同时将呈现负相关的数据按照负相关程度(即各个样本对于成绩的支持度)进行衰减,衰减比例为负相关程度/120。测试集的相关度存储在sum.csv文件中.
提交结果:1.415 考虑影响因素可能是增长以及衰减比例过大越过局部最优(但是估计1.411已经达到局部最优,接下来可以考虑尝试将最优样本调整为1.422,寻找新的梯度)
记录二:在一基础上,只对支持度高的进行调整,调整增长比例为正相关程度/400,调整衰减比例为负相关程度/400。
提交结果:1.412 对于最大梯度为20的相关性文件来说,只对支持度高的进行调整,一定的增加增长比例,降低衰减比例有一定的效果。
在统计梯度(也就是最优方向过程中)发现以1.411和1.422的梯度大相径庭,所以接下来的工作可以考虑采用不同的梯度验证能否跳出局部最优(方法可以只通过在最大支持度测试样本上进行调整,最优增长比例-衰减比例仍需摸索)。