/hardseed

hardseed is a batch seeds and pictures download utiltiy from CaoLiu and AiCheng forum

Primary LanguagePythonGNU General Public License v2.0GPL-2.0

#hardseed yangyang.gnu@gmail.com

##公告

捐赠:如果觉得 hardseed 有用,你可以考虑捐赠点碎银,支付宝帐号 yangyang.gnu@gmail.com

讨论:任何意见建议移步 http://www.v2ex.com/t/123175

声明:我本人绝对尊重各大爱的论坛,提供的资源不仅优质而且免费,我只是懒、足够的懒。请大家支持这些论坛,多用页面访问、多点击页面广告、多解囊捐赠。我在干嘛 @_@#

注意:
[2014-7-24]:慎用源码包中的代理工具。源码包中有个 proxy/ 目录,这是我为小白用户预配置的 goagent 代理工具以方便其正常使用 hardseed。简单来说,goagent 的服务端 GAE 每天有流量限制的,今天之前的预配置版本中,每天最大流量设置为 4G,所有使用该预配置的用户共用这 4G,昨天很多朋友反应无法下载种子和图片,估计是流量耗尽,我登陆 GAE 确认果然如此,所以,0)请有动手能力的朋友尽量用自己的代理工具,可参考 http://www.yangyangwithgnu.net/the_new_world_linux/#index_3_3_3 ;1)我把预配置版本代理的流量上限调整到 GAE 允许的最大值,每天 25G,请小白用户更新配置文件 https://github.com/yangyangwithgnu/hardseed/blob/master/proxy/goagent_3.1.19/local/proxy.ini

##版本

[v0.2.0,新增,2014-7-23 14:16:51]:应 sigmadog 需求,增加抓取 caoliu 上自拍套图(江湖人称“達蓋爾的旗幟”)的功能。
[v0.1.1,修正,2014-7-21 13:09:39]:caoliu 论坛增加了反机器人机制,若翻页过快则视为机器人行为,下载页面为空白页。此版本可应对它的反机器人机制。

##演示

hardseed
hardseed gif demo
running
hardseed gif demo
more seeds and pictures
hardseed gif demo

http://v.youku.com/v_show/id_XNzQxOTk0NTE2.html

##english

hardseed is a batch seeds and pictures download utiltiy from CaoLiu and AiCheng forum. It's easy and simple to use. Usually, you could issue it as follow:

$ hardseed  

or

$ hardseed --saveas-path ~/downloads --topics-range 8 64 --av-class aicheng_west --timeout-download-picture 32 --hate X-Art --proxy http://127.0.0.1:8087  

--help
Show this help infomation what you are seeing.

--version
Show current version.

--av-class
There are 13 av classes:

  • caoliu_west_reposted
  • caoliu_cartoon_reposted
  • caoliu_asia_mosaicked_reposted
  • caoliu_asia_non_mosaicked_reposted
  • caoliu_west_original
  • caoliu_cartoon_original
  • caoliu_asia_mosaicked_original
  • caoliu_asia_non_mosaicked_original
  • caoliu_selfie
  • aicheng_west
  • aicheng_cartoon
  • aicheng_asia_mosaicked
  • aicheng_asia_non_mosaicked

As the name implies, "caoliu" stands for CaoLiu forum, "aicheng" for AiCheng forum, "reposted" and "original" is clearity, you konw which one is your best lover (yes, only one).
The default is aicheng_asia_mosaicked.

--concurrent-tasks
You can set more than one proxy, each proxy could more than one concurrent tasks. This option set the number of concurrent tasks of each proxy.
The max and default number is 8.

--timeout-download-picture
Some pictures too big to download in few seconds. So, you should set the download picture timeout seconds.
The default timeout is 32 seconds.

--topics-range
Set the range of to download topics. E.G.:

  • topics-range 2 16
  • topics-range 8 (I.E., --topics-range 1 8)
  • topics-range -1 (I.E., all topics of this av class)

The default topics range is 128.

--saveas-path
Set the path to save seeds and pictures. The rule of dir: [avclass][range]@hhmmss. E.G., [aicheng_west][2~32]@124908/. The default directory is home directory (or windows is C:\).

--hate
If you hate some subject topics, you can ignore them by setting this option with keywords in topic title, split by space-char ' ', and case sensitive. E.G., --hate 孕妇 重口味. When --hate keywords list conflict with --like, --hate first.

--like
If you like some subject topics, you can grab them by setting this option with keywords in topic title, split by space-char ' ', and case sensitive. E.G., --like 苍井空 小泽玛利亚. When --like keywords list conflict with --hate, --hate first.

--proxy
As you know, the government likes blocking adult websites, so, I do suggest you to set --proxy option. Hardseed supports more proxys:

  • GoAgent (STRONGLY recommended), --proxy http://127.0.0.1:8087
  • shadowsocks, --proxy socks5://127.0.0.1:1080, or socks5h://127.0.0.1:1080
  • SSH, --proxy socks4://127.0.0.1:7070
  • VPN (PPTP and openVPN), --proxy ""

It is important that you should know, you can set more proxys at the same time, split by space-char ' '. As the --concurrent-tasks option says, each proxy could more than one concurrent tasks, now, what about more proxys? Yes, yes, the speed of downloading seed and pictures is very very fast. E.G., --concurrent-tasks 8 --proxy http://127.0.0.1:8087 socks5://127.0.0.1:1080 socks4://127.0.0.1:7070, the number of concurrent tasks is 8*3.
If you wanna how to install and configure various kinds of proxy, please access my homepage "3.3 搭梯翻墙" http://www.yangyangwithgnu.net/the_new_world_linux/#index_3_3
The default http://127.0.0.1:8087.

That's all. Any suggestions let me know by yangyang.gnu@gmail.com or http://www.yangyangwithgnu.net/, big thanks to you. Kiddo, take care of your body. :-)

##中文

硬盘女神,你懂嘀!hardseed 是个种子下载工具,它从浓(ai)情(cheng)蜜(she)意(qu)和爱(cao)意(liu)无(she)限(qu)的地方获取女神种子、图片。

###【翻墙】
你知道,这一切的一切都在墙外,所以你得具备翻墙环境,hardseed 才能正常帮你拉女神。hardseed 支持 goagent、shadowsocks、SSH、VPN (PPTP 和 openVPN)等各类代理模式,甚至你可以并行使用多种代理以极速下载。从普及度、稳定性、高效性来看,goagent 最优。“我一技术小白,平时工作压力本来就大,就想看看女神轻松下,你还让我折腾代理!没人性!”,嘚,亲,咱是做服务的。我帮你配置了一份开箱即用的 goagent,位于 hardseed/proxy/goagent_3.1.19/local/,linux 用户,命令行中运行

$ python proxy.py

windows 亲,双击运行 goagent.exe (管理员权限)。

###【下载】

####『windows』 亲,往右上看,找到“download ZIP”,点击下载。

####『linux』

$ git clone https://github.com/yangyangwithgnu/hardseed.git

###【源码安装】

####『windows』
这基本没 windows 用户什么事儿,除非你有 cygwin,否则你没法编译源码,没事,帮你弄好了,我的定位是牙医界的服务人员,服务很重要,二进制执行程序位于 hardseed\bin\windows\hardseed.exe。

####『linux』
0)唯一依赖 libcurl,请自行安装;
1)代码采用 C++11 编写,gcc 版本不低于 4.7.1。
2)命令行下运行:

$ cd hardseed/build/
$ cmake .
$ make && make install

###【使用】
亲,听好了,运行 hardseed 前务必确保代理程序已正常运行,否则,别说女神,蚊子都碰不到。

####『windows』
先进入 hardseed\bin\windows\,找到并选中 hardseed.exe,右键设置以管理员权限运行该程序,接着键入 alt-d 将光标定位到文件管理器的地址栏中,键入 CMD 启动命令行窗口,再在 CMD 中键入

X:\hardseed\bin\windows> hardseed.exe

这时,hardseed 开始玩命儿为你下载女神图片和种子,经过 2 分钟 8 秒,找到类似 C:\[aicheng_asia_mosaicked][1~128]@014822\ 的目录,女神们那儿等你!

####『linux』
同 windows 下运行一样,全用默认命令行参数运行

$ hardseed

执行完成后,你会看到 /[aicheng_asia_mosaicked][1128]@014822/,你要的都在那儿。或者,玩点高级的

$ hardseed --saveas-path ~/downloads --topics-range 256 --av-class aicheng_west

其中,--saveas-path 指定存放路径为 ~/downloads/;--topics-range 指定解析的帖子范围从第 1 张帖子到第 256 张帖子;--av-class 指定女神类型为欧美。

###【FQA】
Q0:osX 下源码编译报错: ... Linking CXX executable hardseed Undefined symbols for architecture x86_64: "_iconv", referenced from ...
A0:请把 CMakeList.txt 中的 SET(CMAKE_EXE_LINKER_FLAGS "-lcurl -lpthread") 替换成 SET(CMAKE_EXE_LINKER_FLAGS "-lcurl -lpthread -liconv")

Q1:为何 windows 版的可执行文件目录 hardseed\bin\windows\ 下有一堆 cyg*.dll 文件?
A1:hardseed 是用 C++ 编写的遵循 SUS(单一 unix 规范)的原生 linux 程序,理论上,在任何 unix-like(linux、BSD、osX) 系统上均可正常运行,唯独不支持 windows,为让 hardseed 具备跨平台能力,须借由某种工具(或环境)将 hardseed 转换成 windows 下的执行程序。cygwin 就是这种环境,我把 hardseed 源码纳入 cygwin 环境中重新编译,即可生成 windows 下的可执行程序 hardseed.exe,在这个过程中,cygwin 会加入些自己的代码和中转库到 hardseed.exe 中,cyg*.dll 就是各类中转库。

Q2:为何运行 windows 版的执行程序总有如下警告:Preferred POSIX equivalent is: /cygdrive/c/xxxx, CYGWIN environment variable option "nodosfilewarning" turns off this warning. Consult the user's guide for more details about POSIX paths ...,影响正常运行么?
A2:linux 与 windows 有很多基础设施的差异,路径表示方式就算其一,如,前者是 /this/is/linux/path/,后者 C:\this\is\windows\path\,A1 中提过 hardseed 是 linux 下的原生程序,代码中全采用的 linux 路径规则,运行 hardseed.exe 时, cygwin 自动进行路径规则转换,所以出现本问题中的警告信息以告知用户路径可能有变化。这完全不影响 hardseed.exe 正常运行。如果厌恶这些提示,可以在环境变量中增加 CYGWIN=nodosfilewarning (win7 用户:computer - properties - advanced system settings - advanced - environment variables - new,variable name 填入 CYGWIN,variable value 中填入 nodosfilewarning,保存即可)。

Q3:运行 hardseed 后啥都没下载呢?还提示 There is no topic which you like?
A3:有几种可能:
a)未成功翻墙。请自行参阅你的翻墙工具帮助文档,修正即可。windows 用户注意检查是否以管理员权限运行翻墙工具
b)网页翻墙已成功但仍无法下载。请检查你的代理工具是否成功接收 hardseed 的代理请求(如,goagent 窗口中可查看),windows 用户注意检查是否以管理员权限运行 hardseed.exe
c)hardseed 翻墙已成功但仍无法下载。你指定了 --like xxxx 命令行选项,hardseed 将查找标题中是否含有关键字 xxxx,若没有则忽略相关帖子。更换其他关键字。

Q4:如何设置多路代理?
A4: 假定你在 https://shadowsocks.net/get 获取了两个 SS 帐号,一个配置的本地端口为 1080,一个 1081。然后,在 hardseed 的命令行参数设定 --proxy socks5://127.0.0.1:1080 socks5://127.0.0.1:1081,如果你的 --concurrent-tasks 设定为 16(默认值),这时,hardseed 就会启用 2 * 16 条线程并行下载。速度飞快、飞快、快 ...

Q5:如何搜索喜欢的视频?
A5:--like 选项可以指定多个关键字(空格隔开)参数,帖子标题中出现相关关键字之一便纳入下载范围,否则不下载。通常来说,标题中文字有简体、繁体、日文等三种可能,所以你应该都指定,比如,喜欢“护士”和“情侣”系列,先简译日 http://fanyi.baidu.com/#zh/jp/,再简译繁 http://www.aies.cn/,最后指定命令行参数即可 --like 护士 護士 看護婦 人妻 情侣 情侶 カップル

Q6:如何下载高清?
A6:hardseed 并不直接支持高清类型下载,只能间接实现,由 --like 指定“高清”相关关键字进行下载,比如: --like 1080P 720P HD 高清 ハイビジョン

Q7
A7

Q8
A8

##忠告

*年,党之栋梁、国之人才,千万注意身体!