CUDA Of Memory

Question

CUDA Of Memory

pengweiweiwei opened this issue 4 years ago · 11 comments

你好，想请问下跑12G的模型，不支持多GPU么？
我执行了这个指令python3 tools/train_net.py --cfg ./configs/config_car_12g.py --savemodel ./outputs/MODEL_dsgn_v1 -btrain 8 -d 0-7，然后还是出现了
RuntimeError: CUDA out of memory. Tried to allocate 674.00 MiB (GPU 0; 11.78 GiB total capacity; 9.14 GiB already allocated; 665.69 MiB free; 892.32 MiB cached)
我用的显卡是TITAN V的。
期待您的解答，谢谢！

Answer 1 · 2021-03-04T03:42:04.000Z

--multiprocessing你跑的时候有加吗？另外你可以试下单卡 --debug 的时候是否能够顺利跑起来？

Answer 2 · 2021-03-04T09:14:43.000Z

--multiprocessing加了也会报错，另外跑单卡也会出现同样的问题，加了--debug 也不行

Answer 3 · 2021-03-04T09:18:11.000Z

还有想请问下PSMNet应该也是用了3D卷积，为什么那个代码在12G显存上可以跑起来呢，有没有什么有效的方法可以改进呢？

Answer 4 · 2021-03-04T11:42:57.000Z

是的，之前因为3D volume占用显存较大，所以我把很多3D conv缩减后能够大量地降低显存使用。比较奇怪你那边显存还是超了。我建议你可以试着把volume 的 range减小一下，主要是BEV (X/Y)的面积减小进一步减小显存看下。如果有问题可以用--debug调试下

Answer 5 · 2021-03-04T12:07:42.000Z

好的，谢谢

Answer 6 · 2021-03-06T11:55:39.000Z

你好，想请教一个问题，在深度网络训练部分，根据lidar生成深度图的过程中，将lidar投影到图像上，是不是无法保证每个像素都有对应的深度ground truth呢，想请问下这部分是怎么处理的，投影得到的深度值结果可以直接用于模型的训练么？

Answer 7 · 2021-03-06T12:07:26.000Z

是的，投影后直接用cost volume去估计深度就行。只有有深度的pixel做loss，否则就ignore。

Answer 8 · 2021-03-06T12:20:55.000Z

好的，谢谢解答

Answer 9 · 2021-04-13T01:56:04.000Z

你好，我和你遇到了一样的问题，我想请教一下关于12g多gpu依旧报outofmemory这个问题你解决了吗

Answer 10 · 2023-04-22T11:38:34.000Z

你好，我能问一下./configs/default/config_car.py是多少G显存的模型，我12G的GPU适合跑哪个模型

Answer 11 · 2023-04-22T16:38:44.000Z

你好问一下，最后oom的问题解决了吗