/DCIC2019-top-10-code

2019数字**创新大赛 消费者人群画像 信用智能评分

Primary LanguageJupyter Notebook

DCIC2019-top-10-code

2019数字**创新大赛 消费者人群画像 信用智能评分

相关比赛连接https://www.datafountain.cn/competitions/337 本次比赛是移动举办的一个由脱密数据包含27个数值型的特征构和一个分数标签构成, 目的是从训练集上通过数据训练一个模型来预测测试集上的分数

相应的数据和完整代码已经上传

本次比赛由于在脱密处理中,一些异常值会被当成0来进行填充,所以在数据处理当中,需要根据箱型图来判定分布,重新将一些不合理的值还原

特征工程 利用一些业务上的理解 进行一些特征衍生

最后利用lightgbm模型对数据进行参数调整, 利用调整好的参数来做进模型,通过KFold的方式取每次折叠的平均值来当作最后的预测

最后算得验证集上的MAE 0.069 比赛成绩前百分十