CtripSpider

携程爬虫

使用scrapy框架下Spider的派生类CrawlSpiders, CrawlSpider类定义了一些（rule）来提供跟进link的方便的机制，更适合从爬取的网页中获取link并继续爬取
爬取的是携程北京地区的某一时段的酒店信息（酒店名称、图片地址、描述、价格、分数、用户推荐百分比）
少部分酒店的信息条目是缺失的，使用xpath解析的时候会报错，需要特别处理
ctrip.json是爬取下来的酒店信息

onlyou1314/CtripSpider