opendatalab/labelU

上传大文件的合理性?

EasonQYS opened this issue · 7 comments

比如视频标注.只是标时间.没必要传到云空间.是否可以仅渲染.或者本地版我放在某个路径下就可以,否则空间占用和传输速度都不划算。

本地版本,并不会将文件上传到云端,所有数据都存在本地的。

在本地会在labelu内部创建副本吗?我这里准备传很多视频,不想占用两份电脑存储空间。
image

会的。一般会保存在应用的数据目录中,见不同系统的 appdir

嗯嗯,所以我其实这个issue是想讨论合理性,数据标注完,“每天凌晨自动清理”,是否也体现了这个数据存到appdir的不合理性。我自己的本地部署版本,我也不想占用两份空间。labelme是窗体界面,没有这个问题,但是labelbee和labelu好像都会有这个问题?

你说的对,确实会有存在重复数据的问题。不过凌晨自动清理是针对在线版本的,本地版本不会处理。

我们后面想想怎么优化一下😃。

嗯嗯,所以我其实这个issue是想讨论合理性,数据标注完,“每天凌晨自动清理”,是否也体现了这个数据存到appdir的不合理性。我自己的本地部署版本,我也不想占用两份空间。labelme是窗体界面,没有这个问题,但是labelbee和labelu好像都会有这个问题?

主要是因为文件位置可能会发生变化,可能导致无法显示。

或者

  1. 上传前供选择保留副本还是删除?
  2. 在样本列表增加本地文件地址?

嗯嗯。我觉得提供用户标注完是否删除的一个按钮选项是必要的。然后,在上传的地方,可以用不同的策略吗?比如可以选择是副本模式还是软链接模式(ln -s),那么后端处理可能就不是靠浏览器的能力来传了。或者是:除了提交这种方式以外,用户也可以选择配置数据集所在路径(可能是UI界面配置,或者config配置),如果路径符合要求,那么就能进在平台看到。