/jdd_loanPredict

京东发起的JDD大赛的贷款预测代码

Primary LanguageJupyter Notebook

jdd_loanPredict

京东发起的JDD大赛的贷款预测代码 赛题概要

开展信贷业务不仅需要评估客户的风险水平,还需要对客户的借款需求进行预测,做好资金额度与需求的匹配才能提高资金利用率。 赛题背景

金条是京东金融旗下的一款无抵押现金贷产品,申请人只需要在京东金条申请页面填写少量的个人信息即可申请现金贷款。在开展这类信贷业务的时候,除了要评估用户的风险之外,还需要预测用户的借款需求,只有尽可能的给有借款需求的用户分配合适的额度,才能最大限度的增加资金利用率,降低成本并增加收益,因此预测用户的信贷需求是金条产品运营的核心问题之一。 赛题内容

本题目希望参赛者通过竞赛数据中的用户基本信息、在移动端的行为数据、购物记录和历史借贷信息来建立预测模型,对未来一个月内用户的借款总金额进行预测。本赛题中包含了各种维度的序列数据、品类交易数据,选手可以采用各种类型的数据预处理算法、模型融合等技术来解决信贷需求这个关键的商业问题。

赛题数据为业务情景竞赛数据,所有数据均已进行了采样和脱敏处理,字段取值与分布均与真实业务数据不同。 评审标准

数据说明

  1. 训练数据

训练数据为2016-08-03到2016-11-30期间,用户在移动端的行为数据、购物记录和历史借贷信息,及11月的总借款金额。

  1. 评测数据

参赛者需要对每个用户(t_user表中的全部用户)在2016年12月的总借贷金额进行预测。

  1. 文件信息

文件名 数据内容

t_user.csv 用户信息表 t_order.csv 订单信息表 t_click.csv 点击信息表 t_loan.csv 借款信息表 t_loan_sum.csv 月借款总额表

  1. 数据字典

文件名 字段名 字段描述

t_user uid 用户ID age 年龄段 sex 性别 active_date 用户激活日期 limit 初始额度

t_order uid 用户ID buy_time 购买时间 price 价格 qty 数量 cate_id 品类ID discount 优惠金额

t_click uid 用户ID click_time 点击时间 pid 点击页面 param 页面参数

t_loan uid 用户ID loan_time 借款时间 loan_amount 借款金额 plannum 分期期数

t_loan_sum uid 用户ID month 统计月份 loan_sum 借款总额

评分标准

根据选手需要提交的用户总借贷金额预测值,按如下公式计算评分,其中yi真实值,y_hati为预测值,n为用户总数:

提交要求

提交的数据文件应为csv文本,英文逗号分隔,无BOM的utf8编码,不包含列名。文件中只包含两列:用户id(uid),预测的总借贷金额,其中用户id必须唯一,必须包含训练集中的全部用户。