- 分析深圳楼市趋势
- 抓取深圳楼市数据,每天从深圳房地产信息网中抓取以下信息
- 抓取的数据存储在Postgresql数据数据库中,可以使用script.sql来创建数据库中对应的表;
- 长期运行,分析历史趋势,用pandas、matplotlib对这些数据做各种维度的统计分析
- 每天查询最新的预售信息,发现新的预售就及时邮件通知相关人员
- requests
- BeautifulSoap
- schedule
- 安装postgresql数据库
- 在postgresql内创建名字为loushi的数据库
- 在loushi内,使用script/script.sql创建对应的表
- 修改src.Dao.Daobase.py中的数据库连接信息,设置正确的服务器地址和用户名密码
- 如果需要了解一手房源信息,则要配置main.py目录下的config.ini文件
- 运行main.py
- 20180824
- 修改读取一手房源项目详情的方式,由于历史项目较多,估计要好几天,甚至几十天才能抓取完,所以改为先抓取所有项目信息到数据库, 然后再逐个抓取每个项目的详细信息,假如中间出现意外中断,重启程序即可断点续传。而且每抓取完一个项目信息之后,会检查下其他任务, 避免中间其他任务等待时间过长
- 20180821
- 添加功能,NewHSrcProjectCrawler,直接抓取所有一手房源的项目信息到数据库,不抓取详情
- 添加功能,NewHouseMonitor,每小时检查下是否有新的房源通过预售,有的话,就通过config.ini配置信息给相关人员发送邮件通知
- 20180815
- 重构了数据库接口,每种类型数据的接口提取成单独的类
- 20180814
- 支持抓取一手房源信息
- 将main.py文件提取到根目录,便于pyinstaller生成exe文件
- 使用scheduler调度库,每天中午查询一次,抓取相关一手、二手的房源和成交数据
- 输入一个项目名称,生成该项目的报告:项目名称,地址,预售时间,几栋,几套、最高单价及其对应房源房号,最低单价及其对应房号,最高总价,最低总计,然后是所有房源信息列表,把该报告发送到指定邮箱
- 统计分析报告,分析一手、二手房成交的历史趋势