前言
- 源Kernel:Stacked Regressions : Top 4% on LeaderBoard
- 发布kesci:Kaggle-Hourse Prices 房价预测
项目思路
- 数据导入与预处理
- 模块导入
- 数据导入
- Id特征处理
- 异常值处理
- SalePrice特征处理
- 特征工程
- 数据集连接
- 缺失数据分析
- 数据相关性
- 缺失值填充
- 标签编码
- 增加特征
- 倾斜特征
- 独热编码
- 重新划分数据集
- 特征重要性检测
- 基础模型
- 定义交叉验证策略
- 建立基础模型
- 基础模型分数
- 模型融合
- 方法一:模型平均
- 模型平均类
- 模型平均分数
- 方法二:模型叠加
- 模型叠加类
- 模型叠加分数
- 方法一:模型平均
- 模型训练与预测
- 定义评估函数
- 模型训练、预测、评估
- 集成预测
- 生成结果文件