1.确定分类变量。
2.异常数据处理 -> 剔除,填充,插值等进入重复步骤。
3.计算KS, IV,WOE的值
- 分类的标签在其他数据上分的好不好, 标签区别其他变量的强度
4.建立模型,变量选取AUC,p,bias
5.在区间内出现(0,1)出现频率的情况进行切割(分箱)
6.交叉验证,时间内外
7.寻找点进行woe归一化
8.将归一化的结果进行回归
9.求取odds和评分
10.得到评分卡片
11.模型校准
GGCM Model Performance Scorecard
Credit risk scorecards development using R
Building a Scorecard in Practice
Credit Scoring Modellingfor Retail Banking Sector
Credit Scoring, Statistical Techniques and Evaluation Criteria
R里面的glm.fit()是通过irls进行的参数估计,SAS是通过mle进行的参数估计。