/NewsSpider

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

Primary LanguagePython

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

一些说明:

  • 使用urllib2或requests包来爬取页面。
  • 使用正则表达式分析一级页面,使用Xpath来分析二级页面。
  • 将得到的标题和链接,保存为本地文件。