抓取干货集中营图片资源
-
lib/
爬虫核心代码
-
out/
结果文件
-
main.py
主程序入口
-
timer.txt
已爬取网页的最新时间点
-
requirements.txt
python依赖库
-
gank.sh
一键化运行脚本
-
推荐安装pyenv和pyenv-virtualenv, 完全隔离不同项目的开发环境.
-
pyenv的安装, 请参考https://github.com/yyuu/pyenv
-
pyenv-virtualenv的安装, 请参考https://github.com/yyuu/pyenv-virtualenv
-
当然, 你也可以直接使用系统默认安装的python进行操作, 不过平时要养成良好的习惯, 推荐使用前面的方式操作.
-
安装python虚拟环境
pyenv virtualenv 2.7.6 env_gank_io_2.7.6 // 2.7.6: 虚拟环境的python版本, env_gank_io_2.7.6: 虚拟环境
其中, 安装不同版本的python:
pyenv install 2.7.6 // 指定版本号
pyenv activate env_gank_io_2.7.6 // 切换到项目对应的虚拟环境
pip install -r requirements.txt // 安装依赖库
python main.py // 运行项目
为了简化用户操作, 提供一键化操作脚本:
source ./gank.sh
- fork
- modify
- pull request