/spider

爬虫

Primary LanguagePython

python_spider

我也是新手而已,随手改改。 修改自thompson1966/spider

  1. 只下载绿色主题
  2. 按照月份分类,文件夹前添加日期 如 '2018-12[2018-12-12][原创] xxx [30P]'
  3. 使用GBK编码,避免某些文字乱码
  4. 下载前100页内容(其他要账号)
  5. 帖子获取图片少于3张跳过
  6. 修复部分帖子获取图片不成功
  7. 去掉部分特殊字符在Windows不能成功新建文件夹问题

开发环境

  • Windows7 64位
  • Python3.5