/simple-spider

两个简单的python爬虫,爬取教程网站并生成PDF、爬取小说网站下载小说

Primary LanguagePython

simple-spider

两个简单的python爬虫

  1. download_books.py是爬取一个盗版小说网站,思路比较简单,启用了多线程,10M带宽一觉下满了一个盘(大概70G)

  2. python_liaoxuefeng.py是爬取廖雪峰的教程网站,并保存为PDF