2018PINGAN_DrivingRisk_Rank12th

初赛14名 复赛12名 特征不多 初赛时主要有时间区间 速度区间 长短途比例 出行次数 经纬度均值几组特征 维度20+ 对Y值的处理是主要的上分手段

复赛时同时处理分钟级数据和秒级数据 选用双模型进行处理 现在看来是个比较错误的方向 浪费了大量的时间和次数 分数维持在0.12上下 后期抽取分钟级数据后 使用初赛的单模型有了明显提升

之后陷入了特征处理方式的怪圈... 回头看发现也是选择了一个比较错误的方向 又浪费了2 3天的时间 最后几天上升到0.16 很多想法还没做 比较遗憾

可能是我们特征少的原因 数据的敏感度很大 一个特征会对分数产生很大的影响 还有就是没有找到一个合适的评价指标 对特征的选取很耗次数