在本章中,我们将会使用马萨诸塞州波士顿郊区的房屋信息数据训练和测试一个模型,并对模型的性能和预测能力进行测试。通过该数据训练后的好的模型可以被用来对房屋做特定预测,尤其是对房屋的价值。对于房地产商来说,这样的预测模型十分有价值。
该数据集来自UCI机器学习知识库(数据集已下线),于1978年开始统计,包括506个样本,每个样本包括12个特征变量和该地区的平均房价。房价(单价)显然和多个特征变量相关,不是单变量线性回归(一元线性回归)问题,选择多个特征变量来建立线性方程,这就是多变量线性回归(多元线性回归)问题。
Data_collections : https://dsw2-dsw-d20210516070434d645b49b90e0000572303-8888.pcs-gw-cn-shanghai.aliyun.com/lab/tree/download/Boston_house_price/bostonh.csv
阿里云天池 Notebook: https://tianchi.aliyun.com/notebook-ai/detail?postId=220926
[1].预测波士顿房价 https://ypwhs.github.io/machine-learning
[2].很系统的波士顿房价预测研究报告 https://zhuanlan.zhihu.com/p/89873990
[3].波士顿房价预测问题简介 https://minghuiwu.gitbook.io/tfbook/