OpenGVLab/UniHCP

ckpt_task_iter_newest.pth.tar

llllljw opened this issue · 3 comments

你好,我在训练过程中提示
image
请问checkpoints/copy/ckpt_task_iter_newest.pth.tar文件是自动生成的嘛

是的,训练过程ckpt默认会存在这里,启动时没有这个的话会忽略

但是我启动时就会报上面这个错误,提示没有相关文件,请问是什么原因呢?
并且train.sh文件中的ckpt 文件名是写死的,其中的task是不是应该是变量呢,不同的任务编号是不一样的。
image

你这个错误不是python报的,跟这个autoresume没关系, 要对你脚本里line 36 debug, 好像你没有替换 <your partition>. task编号会在code里处理https://github.com/OpenGVLab/UniHCP/blob/46c758b1bec1edb65f20371cfc4bf29359fa7797/multitask.py#LL53C16-L53C16