nicoxiang/geektime-downloader

下载出错

Closed this issue · 5 comments

使用0.9.2的版本下载软件工程之美出错,课程地址是https://time.geekbang.org/column/intro/100023701

报错信息如下

已完成下载41/55An error occurred: parse "https!%5B://static001.g%5D(https://static001.geekbang.org/resource/image/78/9c/788180c8c6dd9b69b2784d2a780a239c.jpg": first path segment in URL cannot contain colon

下载的是markdown文件,章节名称应该是这个,不是很确定,他这个显示41的时候有问题
截屏2023-04-05 17 33 19
@nicoxiang

看了下,文章末尾有一块错误的图片地址(就是报错中的地址),地址中半截是就是顶部的图片地址,应该是作者维护的时候复制错了。最后导致我这边把他当作图片下载,但这个不是一个正确的图片地址。

image

这个我这边没法处理的,因为原文中图片的路径就是坏死的,如果你想下载后面的几篇文章,可能需要你这边手动选择文章,并逐篇下载了。后面版本我做下改动,下载失败的图片我就跳过了。

新的v0.10.2版本已支持跳过有问题的图片