Rank: 6/496
preprocess -> train
採用可以從資料中擷取的各種統計特徵
用lightgbm regression,cv找最佳參數。預測值是Next_Premium/total_Premium。
使用的方法沒有太特別的地方,後來嘗試做些特徵轉換和降維,但並未有大幅改善。受限於時間的關係,也就沒有多嘗試其他方法。觀察前幾名的文件,發現應是主要有幾點的不足:
- 沒有訓練分類模型,來判斷是否會續約後,再用迴歸模型預測值。
- 沒有注意到隱藏在資料中的一些特殊特徵。
- 特徵工程做的很基礎,未做特徵的篩選。