当服务器有4张卡的时候就训练不了了，准确来说是96/GPU数要是16的倍数。因为代码默认跑满四张卡，tensor的size不符合后面的处理。

Question

Li-Gui-233 opened this issue 4 years ago · 1 comments

可以将network_train_meta_learning.py文件的第70行代码修改为self.mymodel = torch.nn.DataParallel(self.mymodel, device_ids=[0, 1, 2])

Answer 1 · 2021-06-15T07:34:24.000Z

Thanks，u are right!