/BigdataCompetion

记录数据挖掘/机器学习竞赛

Primary LanguageJupyter Notebook

天池新人赛【新人赛】工业蒸汽量预测建模算法, 学习特征选择、异常值处理、神经网络模型用

数据为真实数据,主要是匿名特征,匿名特征一般比较蛋疼,特征不好做。

上传到github上,记录学习过程

1、只是用lightgbm跑了个baseline;

2、 进行数据分析,看看训练集和测试集的分布是否一致;

3、根据几种特征选择方法进行特征筛选、组合;

4、keras神经网络模型尝试;