sixs/wenshu_spider

DocID issue

ghyn opened this issue · 15 comments

ghyn commented

运行后decrypt_id中返回的js是这样的 hidescript=String.fromCharCode(+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[],+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!+[]+!

Please help. Thanks!

同问同问,也是这里有问题,没法实现DocID的解密,有劳作者解决下

sixs commented

我这边运行正常,能截下图么

我把你解docid的方法单独抠出来运行,复制了某一次搜索返回的列表页中RunEval值和某一个DocID,无法解密,报错
12
23
然后运行你的程序也报类似的错误

45
@sixs

sixs commented

default
1
单独提取出来也是没问题的,你先确认下是个别解密有问题还是全部有问题,若是前者,在decrypt_id函数中加个异常捕获然后错误重新获取RunEval解决;若是后者,可能为环境问题,报一下你的电脑系统信息和python版本信息。

老哥解决了 我这边缺了js环境 谢谢你,然后在readme里面能大概说下破解docid的过程和相应docid.js如何去编写的过程吗?想跟您学习下

ghyn commented

@Newpeee 朋友,能解释下怎么搞定这个JS环境么?谢谢。

windows环境,安装nood.js就好 @ghyn

ghyn commented

你指的是node.js?

对 打错了 node.js @ghyn

@Newpeee 我装了node.js 也不行 需要配置什么吗?

想问一下,我也安装了node.js还是不行,需要配置什么吗?谢谢@newpee

@lifecrazy 安装完Node.js 跟换cnpm的镜像就好了(执行下面这条语句)
npm install -g cnpm --registry=https://registry.npm.taobao.org

ghyn commented

@sixs 求助大神。文书网现在好像一爬就要验证码,而且你的代码里检查验证码的部分过不了。。。

@ghyn 你的这个问题解决了吗,我也是这样