项目主要爬取苏南四大城市链家网全部租房房源数据,并且得出租金分布、租房考虑因素等建议
主要的文件为:
house_data_crawler.py:爬取苏南各城市租房房源数据的代码(带说明和注释, 此处选择了用Mysql来存储,常用数据库) info.py:租房类型和各城市各区域的信息,供house_data_crawler.py调用 RENT_analysis.ipynb: Jupyter notebook代码,对租房数据进行分析 data_sample.csv: 租房数据,这里只随机选择了12000条,每城市3000条
运行环境:
python3.7
需要安装的包:
requests
pyecharts
pandas
numpy
pymysql