/Click-anti-fraud-forecast

飞桨常规赛:点击反欺诈预测 8月第1名方案,分数89.32,基于Catboost树模型结合特征工程构建点击反欺诈预测模型

Primary LanguagePythonMIT LicenseMIT

飞桨常规赛:点击反欺诈预测 8月第1名方案

一.赛题介绍:

广告欺诈是数字营销需要面临的重要挑战之一,点击会欺诈浪费广告主大量金钱,同时对点击数据会产生误导作用。点击欺诈预测适用于各种信息流广告投放,banner广告投放,以及百度网盟平台,帮助商家鉴别点击欺诈,锁定精准真实用户。

本次比赛提供了约50万次点击数据,数据中对某些特征含义进行了隐藏并进行了脱敏处理。测试集中提供了会话sid及该会话的各维度特征值,选手需要基于训练集得出的模型进行预测,判断该会话sid是否为正常点击,还是作弊行为。

比赛传送门:https://aistudio.baidu.com/aistudio/competition/detail/52

二.项目说明:

点击反欺诈预测是一个二分类问题,判断会话是否为正常点击,还是作弊行为。本次数据信息上数字特征列较多,而树模型对结构化的数据可以更好地拟合,可以很好适用于数据量不大且类别信息较多时。 本项目主要基于Catboost树模型结合特征工程构建点击反欺诈预测模型,于8月取得了第一名的成绩。

三.项目结构:

-README.MD       
-baseline.py          # 主基线代码
-配置说明.txt         # 环境依赖及配置说明
-submission.csv       # 要提交的结果文件

四.运行说明:

根据提供的配置说明文件完成环境配置操作后,直接运行baseline.py文件即可,提交时提交生成的预测结果文件submission.csv。

五.AI Studio项目地址:

https://aistudio.baidu.com/aistudio/projectdetail/2301871