/qiniu_manager

七牛云终端助手

Primary LanguagePythonMIT LicenseMIT

QiniuManager

七牛云本地终端调用(仅适合个人小空间管理)

这个小工具并不会实现所有API功能,只根据个人需要完成功能。

安装

$ pip install qiniumanager --upgrade
# 如果出现权限问题,加上sudo或者用root用户安装

Mac OS 如果出现权限问题,则可用以下方法安装,可执行脚本路径在 /Users/<username>/Library/Python/2.7/bin/

$ pip install qiniumanager --upgrade --user

七牛云存储管理助手 Qiniu Manager

七牛云存储管理助手 Qiniu Manager

positional arguments:
  file                  文件名
  space                 空间名

optional arguments:
  -v, --version         显示程序版本号以及运行环境
  -h, --help            显示此帮助信息
  -x [ns]               导出默认或指定空间文件下载链接
  -l [ns], --list [ns]  显示文件列表
  --size                按大小排序
  --revert              反向排序
  -la, --list-all       显示本地已知所有空间文件列表
  -ld [ns]              调试文件列表输出
  -s [ns]               添加、设置默认空间或查看空间列表
  --alias ALIAS         指定空间关联域名
  -sr ns                删除本地空间
  -c                    查看文件状态
  -cd                   调试查看文件状态的输出
  -r, --remove          删除云文件
  -d, --download        下载文件
  -t TARGET             选择下载`目录`
  -dd                   调试下载
  -p, --private         获取私有下载链接
  -i, --link            获取公开下载链接
  -rn [name]            文件重命名
  -rd [name]            调试文件重命名
  -f, --find            搜索文件
  -gt                   大于指定大小的文件列表
  -lt                   小于指定大小的文件列表
  -k ..., --key ...     查看或添加as、ak

首次使用请设置密钥对
qiniu [-k|--key] <access key> <secret key>

必要情况下请设置默认空间名

查看更多帮助信息
https://github.com/hellflame/qiniu_manager/blob/v1.4.10/README.md

测试

连续不断的升级和更新,越来越让人意识到测试的重要性,也是加快代码升级更新的必要途径。

毕竟,就算通过了测试,也不一定能覆盖所有的可能性,之后应该还会继续更新测试脚本,让每一步都走的稳稳的。

测试脚本位于项目目录下的 test.sh

  • 不给任何参数

将自动进行py2、py3、pypy3测试,测试所有用例

./test.sh 
  • 指定python版本

将针对该python版本进行所有用例测试

./test.sh python
# or
./test.sh python3
# or
./test.sh pypy3
# .etc
  • 指定python路径以及测试模块

将使用该python版本测试指定测试模块

./test.sh python http

现有可选测试模块包括:

command  # 命令行解析测试
crypto  # 加密、解密测试
http  # http请求与获取响应测试
manager  # 功能逻辑测试
progress  # 进度条测试
utils  # 工具测试

测试用例位于 这里 ,只要符合通配符 *_test.py 的模块都在测试范围,也可以进行单个模块的测试

使用方法

使用:

usage: qiniu [-v] [-h] [-x [ns]] [-l [ns]] [--size] [--revert] [-la]
             [-ld [ns]] [-s [ns]] [--alias ALIAS] [-sr ns] [-c] [-cd] [-r]
             [-d] [-t TARGET] [-dd] [-p] [-i] [-rn [name]] [-rd [name]] [-f]
             [-gt] [-lt] [-k ...]
             [file] [space]

显示帮助信息方式

$ qiniu
$ qiniu -h # qiniu --help

基本设置

i.密钥设置
$ qiniu -k <access key> <secret key>
$ qiniu -k # 显示密钥对

这里的AK及SK

ii.空间设置(bucket)
$ qiniu -s share # 可以省略测试域名
$ qiniu -s share --alias 7xqh1q.dl1.z0.glb.clouddn.com # 为share空间绑定测试域名
$ qiniu -s # 显示空间信息(bucket)

space & alias

好吧,一直用的测试域名,对于对外开放的空间访问的话,并不需要设置这个alias,只需要qiniu -s share即可(换成自己的空间名),对于私有空间,对于我而言,这个测试域名的使用是必要的

在每次设置过空间名之后,当前默认空间名都会指向该空间(bucket),可以通过qiniu -s最后一行信息验证默认空间(bucket)

如果不设置空间名的话,对于开放空间可能没有什么影响,但是对于如我一般的免费用户的话,没有开启自定义域名,只能使用测试域名,这样的话,只在下载的时候指定空间名将会导致生成一个无效的链接,主要是无效域名

iii.删除本地保存的空间信息
$ qiniu -sr <space name> # 尝试删除空间名为<space name>的空间信息

该操作仅仅针对本地数据库,并不会影响实际空间的存在;如果删除一个并没有保存进本地数据库的空间名并不会报错,因为在执行SQL语句之前并没有判断该空间名是否存在于数据库(~/.qiniu.sql)中,如果被删除的空间是默认空间的话,需要再一次手动指定默认空间,否则默认空间为空

基本操作

i.上传
$ qiniu <file> # 上传文件到默认空间(bucket)
$ qiniu <file> <space> # 上传文件到空间<space>

这里如果没有设置默认空间名的话,上传结束之后会报错显示不存在这个bucket(空间),因为如果获取不到默认空间名的话,空间名就是''(空字符串),如果上传指定的空间不存在的话,也会报同样的错误

进度条显示偶尔出现满载情况的原因是,,忘了禁用单次上传后获取数据的进度显示,如果某一次网速变慢的话,就会偶尔出现进度条突然挤到100%的情况,因为上传是按照4M大小分块上传,并且需要收集服务器的回馈信息,用于最终创建文件,并且http报文的处理默认是启用进度条的,所以在每次上传分块结束之后有概率看到不连续的数值显示(来自分块上传数据),更新之后已经禁用局部进度条显示

这里由于参数获取机制的问题,如果<file to uplaod>部分接了一个不存在的操作,会被当作上传文件到默认空间处理,qiniu -d等,一般情况下会报错-d 这个文件不存在类似的错误,不过要是真的存在着么一个-d文件的话,真的会尝试上传上去的

七牛云对于上传接口的处理,感觉还有很大一部分出于对安全的考虑,客户端与服务器进行通信时,内容都存在安全校验,upload token以及Qbox token什么的,所以文件分块上传的内容在最终创建文件之前都是没有意义的,需要客户端最终告诉服务器自己上传了哪些块,这些块都是属于哪一个文件的,这样服务器才会让这个文件上传结束,如果我在短时间内上传很多的文件分块,却不上传最终创建文件的block info的话,服务器的临时或者永久存储空间会不会被耗尽捏?或者是不是每一个用户有着最大的缓存大小限制呢?也许这就是对于客户端不信任的结果讷?在文件上传处理上,其实个人的静态文件服务器刚好和七牛云相反,我在一开始便上传了一个文件的基本信息,然后接下来上传的每一个分块都会带有与这个文件ID相匹配的标示,这样的话在第一次上传文件信息的时候文件就已经存在了,剩下的工作就是上传这个文件的每一个分块,如果上传同一个分块,那么服务器在检查header的时候就会直接放弃本脆上传的实体内容,返回成功标识,如果某一个分块上传失败,服务器并不会记录这个块的信息,如果在块不完整的情况下请求一个文件,服务器会返回409错误标识数据不完整。虽然不能说两种处理策略哪一个更好,但是就服务器资盘占用上来说,个人的静态文件处理会好一点

ii.文件列表

默认按照上传时间先后逆排序

$ qiniu -l # 显示当前空间(bucket)文件列表
$ qiniu -l backup # 显示`backup`中的文件列表

可以显示已经保存下来的所有空间的文件列表总表,这里的已知空间可以通过qiniu -s查看空间列表信息

$ qiniu -la # 显示已知所有空间的文件列表

# 在v1.4.4版本之后,缓存下所有空间的文件列表之后才一次性输出,所以等待响应时间会明显变长

在显示的时候其实有一个问题,就是非英文字符在终端打印时所占的宽度与英文字符宽度不同,导致排版略错乱 在现在版本中基本上修复了这个问题

list issue - terminal font type

中文字符很显然打印出来的宽度并不与英文字符打印出来的宽度一致,并且这里的文件名称也转换为utf8字符计算长度(一个中文字符有三个字节的长度),这个问题也会出现在上传或者下载进度条的时候,导致整个进度条看上去长度并不一致

这里存在一个可调式的模式调用

这个模式存在的意义在于让这个请求到响应过程都清晰明了

# 显示列表操作的HTTP发起请求到获取的整个HTTP响应

$ qiniu -ld
$ qiniu -ld <bucket name> # 空间名称

调试结果的可能返回界面

响应结果

在v1.4.0之后应该是类似这样的返回:

iii.文件详情

对于文件名中存在空格或者其他特殊符号的情况,用引号将目标文件名包裹起来就好了,在以下其他地方也适用

$ qiniu -c <filename> # 显示当前空间(bucket)中<filename>的信息(讲真这个信息炒鸡简略)
$ qiniu -c <filename> <space name> # 显示<space name>这个空间(bucket)中<filename>的信息

qiniu -c

好吧,总觉得这些信息甚至都没有这个文件被下载或者引用的次数什么的,意义看上去不是太大的样子。顺便一说,这里服务器返回的文件上传时间被'精确'了10000000倍,好吧,这里应该说至少精确了1000倍(到达毫秒级),剩下的应该是随机值吧(自己做的静态文件服务器也有类似的处理),因为实际上我只觉得秒级别对于普通用户而言已经很精确了

v1.3.3 添加在所有空间中查找的功能

遍历查询

程序会从默认空间开始查询给定文件,直到查找到,或者遍历完所有空间。遍历空间的范围通过 qiniu -s 可以查看。可以给定开始查找的空间,通过 qiniu -c xxxx space ,就可以先从space这个空间开始查找指定文件,找不到的话再从其他空间查找。

由于查看文件详情这样的功能一般都会是人手动查看,所以仅有这个功能添加了自动遍历查找的功能,输出的结果也在这一版本之后发生些许变化(然而再怎么变,官方给的输出都是那么一点点)

文件详情

如果不指定查找的空间的话,就可能出现自动遍历的情况。另外,在输出当中,给出了查找到该文件的空间名称和具体的文件大小(精确到B),以及时间戳(精确到毫秒)。

这里存在一个可调式的模式调用

$ qiniu -cd <filename>
$ qiniu -cd <filename> <space name>

调试结果的可能返回界面

响应结果

v1.3.3 之后调试输出的结果可能会更多一点,毕竟会遍历很多空间

iv.获取下载链接
# 获取开放空间的有效链接
$ qiniu -i <filename> # 获取当前空间(bucket)中<filename>的下载链接
$ qiniu -i <filename> <space name> # 获取<space name>中<filename>的下载链接
# 获取私有空间的有效链接(expire 3600)
$ qiniu -p <filename> # 获取当前空间(bucket)中<filename>的私有下载链接,开放空间返回的链接可下载,但不会被expire限制可下载时间
$ qiniu -p <filename> <space name># 获取<space name>中<filename>的私有下载链接,开放空间返回的链接可下载,但不会被expire限制可下载时间

如果不知道该空间是否为私有空间,直接用qiniu -p <target>获取的链接将保证对于开放空间以及私有空间都有效,前提是能够正确设置空间的测试域名(对于作者这样的免费用户而言)。对于一个只有测试域名的空间来说,这个测试域名也是唯一有效的域名,必须将这个域名通过-s参数绑定给这个空间,否则下载链接将不可用

当然,还是知道空间的开放和私有属性比较好,事先check一下文件的状态也可以,或者直接用-d下载的时候会判断文件链接是否有效

private and public

v.下载
$ qiniu -d <filename> # 下载当前空间(bucket)中的<filename>
$ qiniu -d <filename> <space name> # 下载<space name>空间(bucket)中的<filename>

下载的文件存储在当前目录,与空间中文件名相同,如果当前目录存在同名文件,将用后缀的形式区分新下载的文件和旧文件,当判断文档不存在时,并不会下载空间的默认处理方式,而是报告404错误

正常的话,应该会显示下载进度条

progress

finished

如果崩溃的话,还是老老实实wget url -O <filename>或者wget --content-disposition url好了

这部分在调整了下载缓存大小并且优化了保存时候的状态判断之后,基本上能够独立使用了,不过这部分的http报文处理部分舍弃了对于chucked编码的支持

关于这部分,主要想吐槽一下chuncked编码。其实http报文本身即便不使用chucked编码,也是炒鸡难受的,甚至通过TCP来传递数据也是挺难受的,因为客户端在一开始并不知道要接收多长的数据。。。在一开始,客户端并不知道将要接收多少数据,作为header部分,如果运气不好的话,也许header部分还没有接收完,第一次recv就结束了,然后header就被截断了,也许第一次recv接收太长了,header接收完之后继续接收了报文实体部分,甚至整个报文都接收完了,如果是chucked编码的话,更不巧的是把每一个chucked编码块的那个十六进制长度字符串给截断了,那么接下来到底有多少是真正的实体内容呢?即便第一次获取报文长度运气还好,但是对于chucked编码,每次获取的时候都要对接收到的内容判断一下这次接收的内容里面有多少个chuncked块,以及下一次读取应该需要多少长度等等麻烦的问题,说到底,chuncked编码不过是服务器生成比较方便而已,并没有考虑过客户端的感受。如果某一天客户端也支持在POST数据的时候使用类似chuncked的编码的话,服务器是不是也要稍微烦恼一下捏。虽然现在貌似已经搞定chunked编码了,但是当年貌似真的想的挺复杂的,这里记录下了很多东西

不过,上述问题应该还是只会出现在该项目中包含的http报文处理中,因为想要实现流水式的获取报文,而不是把报文所有内容都接收完之后再处理(看到过类似的处理),这样在面对大文件传输的时候可能对内存会有较大的压力(当然,可以用缓存来解决这个问题),并且能够真实的记录下载报文的进度

由于七牛的服务器并没有使用chucked编码,所以这里就取消了chucked编码支持(在最新的版本中应该已经支持Chunked编码了,虽然用不到)

关于chuncked编码的处理,也许在另一个项目中会继续处理,这里的话,就暂时跳过好了

对于chucked编码,总有一种这是某个人心血来潮想出来的方案,服务器倒是很方便了,每次想要生产多少数据就生产多少数据,为什么就不能在上一次生产数据之后把下一次将要生产的数据的大小的字符串的长度也一起记录进去呢?这样至少我知道下一次需要接收多少字节作为下一个块,甚至知道更下一个块的长度信息,这么做起来真的很难么(现在看起来,曾经的自己还是太年轻太单纯了)

  • v1.2.6中添加指定下载目录的支持
$ qiniu -t <dir> -d <target file> # 在当前默认空间(bucket)中下载<dir>/<target file>
$ qiniu -t <dir> -d <target file> <space name> # 下载<space name>中的文件到<dir>/<target file>

新的支持基本上就是在原来的下载指令后面接上指定目录的操作;在执行操作之前,程序会预先判断指定的目录<dir>是否存在,如果不存在的话,将放弃进一步操作。同样,如果下载的文件名中包含/等特殊字符的,文件最终会保存为实际文件名

  • v1.3.0中添加了调试命令的支持 (-t 参数用来设置存储目录依然是支持的)
$ qiniu -dd <filename>
$ qiniu -dd <filename> <space name>

可能的响应结果如下

vi.删除(默认带回显)
$ qiniu -r <filename> # 删除当前空间(bucket)中的<filename>
$ qiniu -r <filename> <space name> # 删除<space name>空间(bucket)中的<filename>

想要吐槽的是,无论是七牛SDK的返回值规范性还是七牛服务器的返回值的规范性都不是很一致(与自己所认为的规范性不是很一致)

Node:在大概v1.4.7版本左右,支持强制删除选项(不带回显)

$ qiniu -rf <filename> 
$ qiniu -rf <filename> <space>

而且也在发布这个版本前一小段时间内,七牛官方接口发生了一点点变化(然而不测试测试根本不知道=。=),如果删除的文件不存在,则会返回一条文件不存在的错误信息。

v1.7.10版本开始支持通配符匹配删除,也就是说所有的删除都是通配符删除,可以一次性删除多条匹配文件记录

$ qiniu -r *.txt  
$ qiniu -r test-?.png <space>  # 在 <space> 中查询匹配模式 test-?.png

# 无回显的删除
$ qiniu -rf *.mp4
$ qiniu -rf *.data <space>

在带回显的模式下,会一条一条的与用户确认是否删除,而 -rf 模式下删除将会一次性返回每一条文件记录的删除返回值,如果删除出现问题,不会影响继续删除

confuse

其实个人的做法更倾向于在成功时也返回一个json字符串,给出一个status表示操作成功,然而这里并没有。在查看服务器的返回值时,这个就更清楚了,服务器的response中,body部分的确是空的,Content-Length: 0,这也让我需要对这部分请求作特别的处理,比如禁用下载进度条(这是自己写的HTTP报文发送以及接受的方法中需要的)

以及SDK中使用了POST和GET方法,于是在生成Token的时候需要对两种方法传递的参数生成凭证,为什么就不能统一使用一种方法呢?

于是重新添加了一个和验证POST Token差不多的Token的方式(因为token的生成是与传递的数据实体有关的)

这里也出现了Content-Type: application/x-www-form-urlencoded这个一般只在网页上的form表单才出现的content-type。虽然我还不是很清楚这个content-type在这里出现的意义,但是应该是在某个地方处理到了模仿form表单上传数据吧,也说明这部分也许是直接调用了网页端的接口,也许这也是接口规范不一致的表现之一吧(自从有了ajax,我就一直很排斥form表单上传这样的存在了,即便是用js模拟from表单上传这样的行为。好吧,貌似也是因为并不是所有浏览器都支持File,FileReader或者类似的功能的样子,万恶的Old Browsers) (后来发现这个mimetype是用来表单上传的)

vii.重命名
$ qiniu -rn <target file> <to file> # 将当前空间中的<target file>重命名为<to file>
$ qiniu -rn <target file> <to file> <space name> # 将<space name>空间中的<target file>重命名为<space name>空间中的<to file>

sdk move

实际上重命名接口在SDK中和移动资源方法是同一个,并且支持在不同的空间之间进行移动,但是个人认为在命令行中输入这么多参数已经很烦了,也并没有需求在不同空间之间进行资源操作,于是QiniuManager限制了重命名只能在当前空间

如果需要支持在不同空间之间进行资源移动的话,在上述代码中将第二个space换成目标space就好了,还有能够看到的是,里面中文翻译都是叫的空间,但是英文名却叫"bucket",表示并不清楚这个翻译的来源

我是不是应该也把这个叫做不规范讷

  • v1.3.0 新增调试支持
$ qiniu -rd <filename> <another name>
$ qiniu -rd <filename> <another name> <space name>

调试结果的可能返回界面

响应结果

viii.批量导出下载链接及相关操作
$ qiniu -x # 导出当前空间(bucket)中的所有文件链接
$ qiniu -x <space name> # 导出<space name>空间中的所有文件链接

若空间中不存在任何文件的话,导出内容将为空,并且没有提示信息;若空间不存在,则会报错提示不存在该空间

导出链接默认为添加了1h时长安全凭证的链接,过期后不影响开放空间的正常访问,私有空间将受影响。输出以文本方式输出到终端,若想要导出到某一文件,请用重定向

$ qiniu -x > target.txt
$ qiniu -x <space name> > target.txt

批量链接将存放在target.txt

若想要批量下载的话,依然可以使用管道方式

wget

# default list
qiniu -x | xargs -n1 wget --content-disposition

# target list
qiniu -x <space name> | xargs -n1 wget --content-disposition

or curl

# default list
$ qiniu -x | xargs -n1 curl -J -O

# target list
$ qiniu -x <space name> | xargs -n1 curl -J -O

Note: 以下功能在v1.4.4及之后版本提供

ix. 按大小排序

在显示文件列表的时候默认按照上传时间逆序排序,也可以按照文件大小排序,只需要在查看文件列表的时候加上 --size 记号即可

$ qiniu -l --size
$ qiniu -l <space> --size
$ qiniu -la --size

当然,也可以逆序输出,只需要加上 --revert 记号即可:

$ qiniu -l --revert # 按时间排序,从旧到新
$ qiniu -l <space> --size --revert # 按大小排序,从小到大
...
x. 文件大小过滤

如果需要获取文件大小大于 1KB 的文件列表,可以使用 -gt

$ qiniu -gt 1024

则会输出存储的空间中所有文件大小超过1k的文件,反之,若要获取文件大小小于1KB的文件列表,可使用 -lt

$ qiniu -lt 1024
xi. unix-style 文件查找,通配符支持
$ qiniu -f pattern

如要查找所有以 .txt 结尾的文件

$ qiniu -f *.txt

类似查找有很多:

$ qiniu -f wh?t.apk
$ qiniu -f backup-*.zip
...

这里有一个问题

当什么都不过滤的时候,即传入 * 作为过滤的时候,会报错,应该加上 "" 修正问题

$ qiniu -f * # 会报错
$ qiniu -f "*" # pass

如果表达式刚好在当前目录存在匹配,也会出现问题,因为终端会自动把当前目录的匹配结果传给程序,然后就报错了,不过解决方法依然是在表达式两边加上引号即可。

以上功能官方接口并没有原生支持,都是在获取资源列表之后程序处理的结果


Issue

nodename nor servname provided, or not known

如果测试域名配置如下

hostname unknown

可能就会报如下错误,因为这个域名无效('7ktpup.com1.z0.glb.clouddn.com')

hostname not valid

可能的原因是七牛云没有解析所有的测试域名,处理方法就是在配置域名时,需要将测试域名配置为那个可用的域名,如qiniu -s whatever whatever.qiniudn.com(或者在一开始并不用设置测试域名,或者在本机的hosts文件中指定ip),但是实际上并不知道七牛云的域名如何管理的,所以要知道哪个域名是可用的话,在内容管理界面查看外链,就知道至少哪一个域名是可用的了

关注了一段时间,发现这个域名只是偶尔无效(最近无效大概发生在凌晨,这次大概在5点左右?),难道是服务器夜间维护?还是遭到攻击?还是日志统计需要?好吧,无论如何,这是一个问题,我也只能选择合适的时机使用

database is locked

database lock

qiniuManager现在同时只能运行一个实例,因为manager从用户家目录下的一个SQLite数据库文件获取密钥,并且在程序开始运行时获取这个数据库,在程序结束时释放,如果某一个时刻正在下载一个大文件,一直占用数据库的话,再运行程序便会报这个错误。不过貌似并没有出现致命错误(对于SQLite我还不是很了解)。要修复这个问题的话,只要及时释放SQLite就好了,不过我并没有这么做,因为和整个程序一开始设计时候的构思并不一样(其实是因为懒)

现在貌似米有这个问题了的样子

注入漏洞

项目使用SQLite3作为数据库支持,数据库文件位于~/.qiniu.sql,并将密钥对明文存储在数据库中,将空间名称存于数据库,这两个数据由于都是用户自己输入其中的,所以除非自己想的话,自己可以给自己的数据库注入,如果使用了特别的语句想要注入的话,应该还是比较简单的,当然我自己是不会自己尝试的

最新版本中,密钥对采用简单加密存储