项目1:模型评估与验证

波士顿房价预测

准备工作

这个项目需要安装Python 2.7和以下的Python函数库:

你还需要安装一个软件,以运行和编辑ipynb文件。

优达学城推荐学生安装 Anaconda,这是一个常用的Python集成编译环境,且已包含了本项目中所需的全部函数库。我们在P0项目中也有讲解如何搭建学习环境

代码

代码的模版已经在boston_housing.ipynb文件中给出。你还会用到visuals.py和名为housing.csv的数据文件来完成这个项目。我们已经为你提供了一部分代码,但还有些功能需要你来实现才能以完成这个项目。

运行

在终端或命令行窗口中,选定boston_housing/的目录下(包含此README文件),运行下方的命令:

jupyter notebook boston_housing.ipynb

这样就能够启动jupyter notebook软件,并在你的浏览器中打开文件。

数据

经过编辑的波士顿房价数据集有490个数据点,每个点有三个特征。这个数据集编辑自加州大学欧文分校机器学习数据集库(数据集已下线).

特征

  1. RM: 住宅平均房间数量
  2. LSTAT: 区域中被认为是低收入阶层的比率
  3. PTRATIO: 镇上学生与教师数量比例

目标变量

  1. MEDV: 房屋的中值价格

参考

Cross Validation and Grid Search Z table 关于Cross Validation(交叉验证) 不能更简单通俗的机器学习基础名词解释