/houserent

根据小区名字或者搜索关键字爬取并识别最近30天以内的58同城的个人房源

Primary LanguagePython

介绍

根据小区名字或者搜索关键字爬取并识别最近30天以内的58同城的个人房源。

个人房源特征(判断条件):
    一般个人房源他最近发布的房子是1个,或者会发布两个以上一样的房源。
    
最近30天以内:
    一般房子基本上会在30天以内被租出去

安装

pip install -r requirements.txt

运行

cd houserent
scrapy crawl my58 -a key=闵浦新苑,瑞和新苑 -a days=30

参数说明

key 小区名或者搜索关键字,多个小区用英文逗号隔开
days 表示的是发布房源的时间到今天的间隔时间,间隔时间小于这个值都会被爬取到

结果

在文件items.jl里面有个urls字段,用浏览器打开即可