IJCAI-18 阿里妈妈搜索广告转化预测复赛第94名方案

感谢wzb同学倾情相助！

赛题以阿里巴巴海量真实交易数据为背景，通过构建预测模型预估用户的购买意向
方案以数据清洗、特征提取、模型训练、模型融合的步骤进行，最终复赛排名94/5204
1_load_data:数据读入，简单的预处理
2_feature_extract:特征提取，包括一些统计特征和组合特征，将结果写入中间文件
3_gen_train_data:将中间文件合并成最终的训练测试数据
4_lightGBM_test:构建LGB单模型预测
5_stacking_lr:比赛后期进行模型stacking时使用的lr模型，由于lr模型要对特征进行ont-hot处理，故单独列出
6_stacking_modle:使用LGB,XGB和RF模型的stacking
7_stacking_2nd:第二层stacking
8_logloss_reverse:均值平滑
bayes_smoothing:贝叶斯平滑
my_utils:常用函数的封装
vector_method:对多值特征的向量化处理（线上成绩一般，最后未使用）

Yangtze121/-IJCAI-18-

IJCAI-18 阿里妈妈搜索广告转化预测复赛第94名方案

感谢wzb同学倾情相助！