/Python-financial-risk-control-scorecard-model-and-data-analysis

python金融风控评分卡模型和数据分析微专业课包含《python信用评分卡建模(附代码)》,《python风控建模实战lendingClub》,《金融现金贷用户数据分析和画像》三套课程系列,共计250节课左右,录制时间超过3年,定期更新。这套微专业课程是互联网上最全,最专业的python信贷建模教程。

Primary LanguagePython

Python credit model and data analysis

python金融风控评分卡模型和数据分析微专业课:http://dwz.date/b9vv 此微专业课包含《python信用评分卡建模(附代码)》,《python风控建模实战lendingClub》,《金融现金贷用户数据分析和画像》三套课程系列,共计250节课左右,录制时间超过3年,定期更新。这套微专业课程是互联网上最全,最专业的python信贷建模教程。

作者Toby:持牌照消费金融模型专家,和中科院,中科大教授保持长期项目合作;和同盾,聚信立等外部数据源公司有项目对接。熟悉消费金融场景业务,线上线下业务,包括现金贷,商品贷,医美,反欺诈,汽车金融等等。模型项目200+,擅长Python机器学习建模,对于变量筛选,衍生变量构造,变量缺失率高,正负样本不平衡,共线性高,多算法比较,调参等疑难问题有良好解决方法。

(原创课程,版权所有,项目合作QQ:231469242,微信公众号:pythonEducation)

课程介绍

python金融风控评分卡模型和数据分析微专业课包含《python信用评分卡建模(附代码)》,《python风控建模实战lendingClub》,《金融现金贷用户数据分析和画像》三套课程系列,共计250节课左右,录制时间超过3年,定期更新。这套微专业课程是互联网上最全,最专业的python信贷建模教程。

针对银行,消费金融的现金贷等线上贷款场景,金融信贷领域建模型和数据分析很难?逻辑回归评分卡/catboost/xgboost/lightgbm/等模型用python一次全部搞定!由易到难,带你从菜鸟轻松晋级kaggle级建模高手。碰到问题还有老师答疑哦 ~实操项目包括德国信用卡数据,P2P的lendingClub和华为举办的消费者信用评分百万奖金挑战赛,课程建模数据量10万+,都是干货和经典。

《python信用评分卡建模(附代码)》:360度讲解python信用评分卡构建流程,附代码和老师答疑。弥补网上信息参差不齐短板

《python风控建模实战lendingClub》此课程是针对集成树模型,包括catboost,lightgbm,xgboost。这两个课程算法原理是不同的。

此课程catboost集成树算法有诸多优点,自动化处理缺失数据,自动化调参,无需变量卡方分箱。学员学完后不再为数据预处理,调参,变量分箱而烦恼。此教程建立模型性能卓越,最高性能ks:0.5869,AUC:0.87135,远超互联网上其它建模人员性能。

《金融现金贷用户数据分析和画像》:此课程用python代码对LendingClub平台贷款数据分析和用户画像,针对银行,消费金融,现金贷等场景,教会学员用python实现金融信贷申请用户数据分析。项目采用lendingclub 12万多条真实信贷数据,包括用户年收入,贷款总额,分期金额,分期数量,职称,住房情况等几十个维度。通过课程学习,我们发现2019年四季度时候,美国多头借贷情况非常严重,为全球系统性金融危机埋下种子。

课程目的

为了从银行/消费金融公司的角度将信贷损失降到最低,银行需要制定决策规则,确定谁批准贷款,谁不批准。 在决定贷款申请之前,贷款经理会考虑申请人的信用水平。lendingClub信贷数据包含有关100多个变量的数据,以及10万多个贷款申请者被认为是好信用风险还是坏信用风险的分类。 预期基于此数据开发的预测模型将为银行经理/CRO/贷前审批人员提供指导,以根据他/她的个人资料来决定是否批准准申请人的贷款。用户画像和数据分析为高层提供决策依据,熟悉公司客户特征,为定制营销做好充分基础工作。

课程特点 1.了解机器学习建模实战,lendingClub包含几十万条实操数据,消费者信用评分竞赛也有十万多建模数据。学员可以跟着视频筛选变量,建模,体验快乐成功感! 2.课程为实战类,提供课程涉及python代码和建模数据,在第17课的参考资料下载(电脑端登录) 3.完善售后服务,提供售前售后邮件答疑,QQ答疑。

课程目录

《python信用评分卡建模(附代码)》

章节1前言 章节1Python环境搭建 课时1 建评分卡模型,python,R,SAS谁最好? 课时2 Anaconda快速入门指南 课时3 Anaconda下载和安装 课时4 canopy下载和安装 课时5 Anaconda Navigato导航器 课时6 python安装第三方包:pip和conda install 课时7 Python非官方扩展包下载地址 课时8 Anaconda安装不同版本python 课时9 jupyter1_为什么使用jupyter notebook? 课时10 jupyter2_jupyter基本文本编辑操作 课时11 如何用jupyter notebook打开指定文件夹内容? 课时12 jupyter4_jupyter转换PPT实操 课时13 jupyter notebook用matplotlib不显示图片解决方案

章节2 python编程基础知识 课时14 Python文件基本操作 课时15 变量_表达式_运算符_值 课时16 字符串string 课时17 列表list 课时18 程序的基本构架(条件,循环) 课时19 数据类型_函数_面向对象编程 课时20 python2和3的区别 课时21 编程技巧和学习方法

章节3 python机器学习基础 课时22 UCI机器学习常用数据库介绍 课时23 机器学习书籍推荐 课时24 如何选择算法 课时25 机器学习语法速查表 课时26 python数据科学常用的库 课时27 python数据科学入门介绍(选修)

章节4 德国信用评分数据下载和介绍 课时28 35德国信用评分数据下载和介绍

章节5信用评分卡开发流程(上) 课时29 评分卡开发流程概述 课时30 第一步:数据收集 课时31 第二步:数据准备 课时32 变量可视化分析 课时33 样本量需要多少? 课时34 坏客户定义 课时35 第三步:变量筛选 课时36 变量重要性评估_iv和信息增益混合方法 课时37 衍生变量05:01 课时38 第四步:变量分箱01:38

章节6信用评分卡开发流程(下) 课时39 第五步:建立逻辑回归模型 课时40 odds赔率 课时41 woe计算 课时42 变量系数 课时43 A和B计算 课时44 Excel手动计算坏客户概率 课时45 Python脚本计算坏客户概率 课时46 客户评分 课时47 评分卡诞生-变量分数计算 课时48 拒绝演绎reject inference 课时49 第六步:模型验证 课时50 第七步:模型部署 课时51 常见模型部署问题

章节7 Python信用评分卡-逻辑回归脚本 课时52 Python信用评分卡脚本运行演示 课时53 描述性统计脚本_缺失率和共线性分析 课时54 woe脚本(kmean分箱) 课时55 iv计算独家脚本 课时56 Excel手动推导变量woe和iv值 课时57 评分卡脚本1(sklearn) 课时58 评分卡脚本2(statsmodel) 课时59 生成评分卡脚本 课时60 模型验证脚本

章节8PSI(population stability index)稳定指标 课时61 拿破仑远征欧洲失败/华尔街股灾真凶-PSI模型稳定指标揭秘 课时62 excel推导PSI的计算公式 课时63 PSI计算公式原理_独家秘密 课时64 PSI的python脚本讲解

章节9难点1_坏客户定义 课时65 坏客户定义错误,全盘皆输 课时66 不同场景坏客户定义不一样,坏客户定义具有反复性 课时67 坏客户占比不能太低 课时68 vintage源于葡萄酒酿造 课时69 vintage用于授信策略优化

章节10难点2_woe分箱 课时70 ln对数函数 课时71 excel手动计算woe值 课时72 python计算woe脚本 课时73 Iv计算推导 课时74 woe正负符号意义 课时75 WOE计算就这么简单?你想多了 课时76 Kmean算法原理 课时77 python kmean实现粗分箱脚本 课时78 自动化比较变量不同分箱的iv值 课时79 woe分箱第三方包脚本

章节11难点3_逻辑回归是最佳算法吗? 课时80 逻辑回归是最优算法吗?No 课时81 xgboost_支持脚本下载 课时82 随机森林randomForest_支持脚本下载 课时83 支持向量SVM_支持脚本下载 课时84 神经网络neural network_支持脚本下载 课时85 多算法比较重要性_模型竞赛,百万奖金任你拿

章节12难点4_变量缺失数据处理 课时86 imputer-缺失数据处理 课时87 xgboost简单处理缺失数据 课时88 catboost处理缺失数据最简单

章节13难点5.模型验证 课时89 模型需要验证码? 课时90 商业银行资本管理办法(试行) 课时91 模型验证_信用风险内部评级体系监管要求 课时92 模型验证主要指标概述 课时93 交叉验证cross validation 课时94 groupby分类统计函数 课时95 KS_模型区分能力指标 课时96 混淆矩阵(accuracy,precision,recall,f1 score)

章节14难点6.逻辑回归调参 课时97 菜鸟也能轻松调参 课时98 调参1_Penalty正则化选择参数 课时99 调参2_classWeight类别权重 课时100 调参3_solver优化算法选择参数 课时101 调参4_n_jobs 课时102 L-BFGS算法演化历史 课时103 次要参数一览

章节16 风控管理和诈骗中介(选修) 课时104 网络信贷发展史 课时105 诈骗中介 课时106 风控管理 课时107 告别套路贷,高利贷,选择正确贷款方式

章节17 2018-2019消费金融市场行情 课时108 揭秘:近年消费金融火爆发展根本原因 课时109 持牌照消费金融公司盈利排行榜 课时110 消费金融,风控技术是瓶颈 课时111 谁能笑到最后:2018-2019消费金融公司注册资本 课时112 萝卜加大棒:**政策监管趋势独家预测 课时113 信用是金融交易的基石_P2P倒闭潮秘密

章节18 2018-2019年全球宏观经济 课时114 专家不会告诉你的秘密:美元和黄金真实关系 课时115 宏观经济主要指标:债务率和失业率 课时116 2019年**宏观经济分析_赠人民银行发布2018n年**金融稳定报告 课时117 2019年G20国家宏观经济信息汇总_供下载 课时118 全球系统金融风险 课时119 基尼系数_贫富差异指标 课时120 GDP_利率_通货膨胀 课时121 失业率_债务率 课时122 贸易差额_中美贸易战根本原因 课时123 信用评级_阿根廷金融危机独家解读

《python风控建模实战lendingClub》

章节1 python编程环境搭建 课时1风控建模语言,python,R,SAS优劣对比 课时2Anaconda快速入门指南 课时3Anaconda下载安装 课时4canopy下载和安装 课时5Anaconda Navigator导航器05:38 课时6python第三方包安装(pip和conda install) 课时7Python非官方扩展包下载地址 课时8Anaconda安装不同版本python 课时9为什么使用jupyter notebook及如何安装 课时10如何用jupyter notebook打开指定文件夹内容? 课时11jupyter基本文本编辑操作 课时12jupyter生成在线PPT汇报文档 课时13jupyter notebook用matplotlib不显示图片解决方案

章节2 python编程基础 课时14Python文件基本操作 课时15python官网 课时16变量_表达式_运算符_值 课时17字符串string 课时18列表list 课时19程序的基本构架(条件,循环) 课时20数据类型_函数_面向对象编程 课时21python2和3区别 课时22编程技巧和学习方法

章节3 python机器学习基础知识 课时23UCI机器学习数据库介绍 课时24机器学习书籍推荐 课时25如何选择算法 课时26sklearn机器学习算法速查表 课时27python数据科学常用的库 课时28python数据科学入门介绍(选修)

章节4 lendingClub业务介绍(P2P鼻祖) 课时29lendingClub业务简介 课时30lendingclub债务危机及深层次时代背景 课时31lendingClub官网数据下载(或本集参考资料下载)

章节5catboost基础介绍 课时32catboost基础知识讲解-比xgboost更优算法登场 课时33catboost官网介绍

章节6 lengding Club实战_catboost分类器模型 课时34数据清洗和首次变量筛选 课时35catboost第三方包下载和安装 课时36import导入建模的包 课时37读取数据和描述性统计 课时38train,test训练和测试数据划分 课时39fit训练模型 课时40模型验证概述 课时41树模型需要相关性检验吗? 课时42交叉验证cross validation 课时43混淆矩阵理论概述,accuracy,sensitivity,precision,F1分数 课时44混淆矩阵python脚本实现 课时45计算模型ks(Kolmogorov-Smirnoff) 课时46catboost1_建模脚本连贯讲解 课时47catboost2_第二次变量筛选 课时48catboost3_分类变量cat_features使用

章节7KS(Kolmogorov–Smirnov)模型区分能力指标 课时49KS简介 课时50step1获取模型分 课时51step2_计算ks_方法1 课时52step3_计算ks_方法2 课时53step4_计算ks_excel推理 课时54step5_绘制KS图 课时55step6_KS评估函数 课时56step7_KS脚本汇总_分治算法 课时57step8_KS缺陷

章节8AUC(Area Under Curve)模型区分能力指标 课时58excel绘制ROC曲 课时59python计算AUC很简单 课时60python轻松绘制ROC曲线 课时61AUC评估函数_AUC多大才算好? 课时62Gini基尼系数基本概念和AUC关系

章节9pickle保存模型 课时63pickle保存和导入模型包_避免重复训练模型时间

章节10PSI模型稳定性评估指标(上) 课时64拿破仑和希特勒征服欧洲为何失败?数学PSI指标揭露历史真相 课时65excel手把手教你推导PSI的计算公式 课时66PSI计算公式奥义 课时67PSI的python脚本讲解

章节11PSI模型稳定性评估指标(下) 课时68step1.筛选lendingClub2018年Q3和Q4数据 课时69step2_计算train,test,oot模型分 课时70step3.计算Q3和Q4模型分PSI

章节12模型维度与边际效应 课时71边际效应基本概念 课时72模型维度与边际效应,变量越多越好吗? 课时73降维实操,结果让人吃惊! 课时74模型变量数量越多,区分能力(ks)越高吗?

章节13catboost分类变量处理 课时75 One-hot encoding热编码 课时76 cat_features分类变量处理(数值型)1 课时77 cat_features分类变量处理(字符串类型) 课时78 不同分类变量处理方法的结果对比

章节14catboost调参 课时79GridSearchCV网格调参简述 课时80iterations树的颗树 课时81eval_metric评估参数(logloss_AUC_Accuracy_F1_Recall) 课时82learning_rate学习率 课时83树深度depth(max_depth) 课时84 l2_leaf_reg正则系数L2调参

章节15多算法比较 课时85xgboost分类器模型 课时86lightgbm分类器建模 课时87逻辑回归分类器和多算法比较结果

章节16消费者信用评分实战_回归模型 课时88机器学习回归竞赛_一百万奖金挑战 课时89线性回归基础知识(最小二乘法OLS) 课时90梯度下降法gradient descent 课时91误差error_偏差bias_方差variance 课时92shrinkage特征缩减技术_正则化 课时93ridge岭回归_lasso回归_elasticNetwork弹性网络 课时94sklearn_ridge岭回归脚本 课时95逻辑回归_regression脚本 课时96支持向量回归SVR脚本 课时97随机森林randomForest回归脚本 课时98xgboost regression回归脚本 课时99catboost regressor回归脚本 课时100lightgbm基础知识讲解 课时101lightgbm regressor回归脚本 课时102sequencial线性模型回归预测脚本

《金融现金贷用户数据分析和画像》

章节1python编程环境搭建 课时1.金融现金贷用户数据分析和画像_介绍视频 课时2.Anaconda快速入门指南 课时3.Anaconda下载安装 课时4.python第三方包安装(pip和conda install) 章节2金融现金贷用户数据分析和画像 课时5.描述性统计-知己知彼百战百胜 课时6.好坏客户占比严重失衡 课时7不要用相关性分析杀人 课时8变量相关性分析-你不知道的秘密 课时9贷款金额和趋势分析-2018年Q4信贷略有缩紧 课时10产品周期分析-看来lendingclub是短周期借贷平台 课时11用户工龄分析-10年工龄用户最多 课时12年收入分析-很多美国人年薪5万美金左右 课时13住房情况与贷款等级-原来美国大部分都是房奴 课时14贷款人收入水平_贷款等级_收入核实多因子分析 课时15贷款用途-美国金融危机浮出水面