/DL_CTR

基于科大讯飞AI营销算法比赛实现CTR深度学习方法

Primary LanguageJupyter Notebook

DL_CTR

注:data文件夹用来存放特征矩阵,后续的DeepFM、FM等模型需要使用GBDT_LR文件夹内feature_engineer文件夹处理的特征矩阵。

1、数据集下载:科大讯飞初赛数据集下载

2、GBDT_LR模型:将连续特征通过GBDT离散化并结合原类别特征,使用CSR矩阵存储One-Hot以后的特征矩阵,进而用LR模型训练。

3、DeepFM模型参考DeepFM参考链接,其中FM模型的实现只需要将DeepFM中的Deep部分去掉即可实现。安利一个推荐系统的博客,推荐系统博客。本人关于DeepFM的博客

4、Deep & Cross Network(DCN)模型参考DeepFM,实现EarlyStopping、L2正则化、Dropout,详见DCN文件夹。DCN的博客

5、Product-based Neural Networks(PNN)模型参考DeepFM,实现EarlyStopping、Dropout、inner-product和outer-product,通过use_inner参数来调用,详见PNN文件夹。PNN的博客

6、Neural Factorization Machines(NFM)模型参考DeepFM,实现EarlyStopping、Dropout,详见NFM文件夹。NFM的博客

7、Attentional Factorization Machines(AFM)模型参考NFM,详见AFM文件夹。AFM的博客

注:NFM、DeepFM训练模型速度较快;