团队名称:吃货联盟。最终排名37

第一题做的比较差,只有40多分,不丢人了。主要介绍2,3题思路。 第二题提取了与SQL语句相关的特征,RF单模型96.71分 第三题提取了跟反垃圾有关的字段个数作为特征,GBDT单模型95+,对40W无标签数据进行预测,将预测结果加入训练集,重新训练GBDT模型,在测试集上进行预测。