Coder-Sakura/PixiC

出现大量的未被删除的作品却显示已删除的现象

jiut opened this issue · 11 comments

jiut commented

短时间大量请求被pixiv ban了,停止请求后3分钟恢复。

这个只有从限制频次下手,有别的方法可以分享下

jiut commented

可以改成已经下载好的就不检测吗?

这个是访问接口获取数据都拿不到了,最近在尝试其他接口,晚上下班再折腾折腾

@jiut 至于下载好的就不检测是插画下载完成后就不请求了?

jiut commented

每个下载完成的可以写个缓存记录一下

短时间大量请求被pixiv ban了,停止请求后3分钟恢复。

这个只有从限制频次下手,有别的方法可以分享下

请问应该如何限制频次呢?比如我每次发生请求隔几秒,应该怎么设置呢

短时间大量请求被pixiv ban了,停止请求后3分钟恢复。
这个只有从限制频次下手,有别的方法可以分享下

请问应该如何限制频次呢?比如我每次发生请求隔几秒,应该怎么设置呢

@pkr5277
bookmark.py line 222 增加休眠

for pid in pid_list:
    pool.put(self.thread_by_illust,(pid,),callback)
time.sleep(60)

crawler.py line 258 增加休眠

_count = 0
for pid in all_illust:
    pool.put(self.thread_by_illust,(pid,),callback)
    _count += 1
    if _count >= 48:
        logger.info("累积到48张,休眠1分钟")
        time.sleep(60)
        _count = 0
  • 之前测试发现的是,短时间内请求超过192次左右,就会被ban3分钟(2022.8.16);测了2个接口发现都会被ban(ajax/illust和touch/ajax/illust/details)
  • 这个休眠时间可以根据实际来定,处理比较粗暴
  • 能想到的解决办法其实也有,在被ban之后转定时请求,直至解ban回复数据为止;
  • 补点自己的吐槽:下班后没啥心情写代码,这块已经好久没更新了,最近有空填一填坑吧😴

难受还没修复

jiut commented

pixiv下载插件也是靠加了一个间隔时间来解决的

pixiv下载插件也是靠加了一个间隔时间来解决的

大佬你是咋解决的

jiut commented

pixiv下载插件也是靠加了一个间隔时间来解决的

大佬你是咋解决的

我也是一直没有解决这个问题。每次使用时是可以在触发限制之前更新几十张的,通过修改bookmark.py来分别更新公开和未公开收藏。就像这样勉强能用。

@jiut @pkr5277 @Kohinata-Miku 2.1.7已修复,有空可以试一下