MhLiao/DB

segmentation fault(core dump)

Swordfish1990 opened this issue · 2 comments

我在运行训练程序train.py时遇到错误:segmentation fault(core dump)
99
我看到之前有相同的提问作者回答是DCN的编译问题,但我的DCN编译是成功的
78
当然我自己也觉得是DCN这块的问题,于是我把backbone由deformable_resnet50改为resnet50,不使用DCN,然后程序就正常运行了。
这里我有两点猜测:要么是DCN的代码有隐藏的bug,要么是我编译时依赖的CUDA版本有问题。我的CUDA是9.0,符合requirements的最低要求,但不是建议的10.1版本,难道是这个问题?不知道是否有使用9.0且成功运行的同学?

我又升级了CUDA10.1,然而问题依然存在。

你好,我是在convert_to_onnx.py中报了这个错误,然而我在其他训练和测试的代码都能运行成功,cuda版本是11.2,请问你解决了吗

抱歉,时间过去太久,怎么解决的忘记了。我应该是升级了相关软件的版本,现在torch1.12.1、cuda11.6、gcc9.4.0,编译DCN后运行正常。

你好,我是在convert_to_onnx.py中报了这个错误,然而我在其他训练和测试的代码都能运行成功,cuda版本是11.2,请问你解决了吗