/Kaggle-HoursePrices

Kaggle竞赛入门项目——房价预测

Primary LanguageJupyter Notebook

前言

项目思路

  • 数据导入与预处理
    • 模块导入
    • 数据导入
    • Id特征处理
    • 异常值处理
    • SalePrice特征处理
  • 特征工程
    • 数据集连接
    • 缺失数据分析
    • 数据相关性
    • 缺失值填充
    • 标签编码
    • 增加特征
    • 倾斜特征
    • 独热编码
    • 重新划分数据集
    • 特征重要性检测
  • 基础模型
    • 定义交叉验证策略
    • 建立基础模型
    • 基础模型分数
  • 模型融合
    • 方法一:模型平均
      • 模型平均类
      • 模型平均分数
    • 方法二:模型叠加
      • 模型叠加类
      • 模型叠加分数
  • 模型训练与预测
    • 定义评估函数
    • 模型训练、预测、评估
    • 集成预测
    • 生成结果文件