- Windows 10 i5-6500U /
- Numpy 1.11.3
- pandas 0.19.2
- catboost 0.2.2
- sklearn 0.19.1
code/ zng_tools 计算模型提升度用到的工具包
##1. 特征分析
###变量属性(连续、离散)记录到xml、缺失值情况分析、特征IV情况观察(线下已完成) ###模型选择 先后尝试了
- 评分卡模型 线下最佳AUC 0.79
- SVM 线下AUC 0.77
- NN 线下成绩不佳
- GBDT 线下AUC 0.82
- Xgboost 线下AUC 0.82
- LightGBM 线下AUC 0.84
- CatBoost 线下AUC 0.858
根据各个模型(局部调参)整体结果后选择精度较高的catboost作为主模型