Alibaba-OGeek-competition-model

这个比赛是个难度比较大的比赛,不光是常规的机器学习操作,还涉及到一些NLP的知识。这是楼主第一次参加天池比赛,很感谢队友们的帮助。 我们初赛排名第81名,复赛排名45名(45/2888)

赛题背景: 在搜索业务下有一个场景叫实时搜索(Instance Search),就是在用户不断输入过程中,实时返回查询结果。

此次赛题来自OPPO手机搜索排序优化的一个子场景,并做了相应的简化,意在解决query-title语义匹配的问题。简化后,本次题目内容主要为一个实时搜索场景下query-title的ctr预估问题。本次赛题为开放型算法挑战赛,优秀的解决方案会对我们解决这个场景以及其它场景下的问题带来极大的启发。我们期待优秀的你和你的团队能够投入进来!

赛题场景

数据内容及数据量

赛题场景

初赛数据量: 训练数据:200万 验证数据:5万 测试数据1:5万 测试数据2:25万

特征工程