/spider

Primary LanguagePython

spider

1.BeautifulSoup 通过类名获取数据的时候应该是soup.select('.sister') 通过id获取数据的时候应该是soup.select('#link')

增加网站图片爬取

2.正则表达式抓取豆瓣书籍

3.#正则表达式抓取猫眼电影 多进程 文件读写 request 正则 4.今日头条街拍mongodb数据库添加 5.学习Ajax请求,爬取微博 6.GuGu网站名片下载