本次比赛建模系统环境及思路

系统及涉及的依赖的软件包版本

  • Windows 10 i5-6500U /
  • Numpy 1.11.3
  • pandas 0.19.2
  • catboost 0.2.2
  • sklearn 0.19.1

依赖模块

code/ zng_tools 计算模型提升度用到的工具包

##1. 特征分析

###变量属性(连续、离散)记录到xml、缺失值情况分析、特征IV情况观察(线下已完成) ###模型选择 先后尝试了

  • 评分卡模型 线下最佳AUC 0.79
  • SVM 线下AUC 0.77
  • NN 线下成绩不佳
  • GBDT 线下AUC 0.82
  • Xgboost 线下AUC 0.82
  • LightGBM 线下AUC 0.84
  • CatBoost 线下AUC 0.858

根据各个模型(局部调参)整体结果后选择精度较高的catboost作为主模型

遗传算法参数寻优

根据正样本个数选择阈值