segmentation fault(core dump)
Swordfish1990 opened this issue · 2 comments
Swordfish1990 commented
我在运行训练程序train.py时遇到错误:segmentation fault(core dump)
我看到之前有相同的提问作者回答是DCN的编译问题,但我的DCN编译是成功的
当然我自己也觉得是DCN这块的问题,于是我把backbone由deformable_resnet50改为resnet50,不使用DCN,然后程序就正常运行了。
这里我有两点猜测:要么是DCN的代码有隐藏的bug,要么是我编译时依赖的CUDA版本有问题。我的CUDA是9.0,符合requirements的最低要求,但不是建议的10.1版本,难道是这个问题?不知道是否有使用9.0且成功运行的同学?
我又升级了CUDA10.1,然而问题依然存在。
stealth0414 commented
你好,我是在convert_to_onnx.py中报了这个错误,然而我在其他训练和测试的代码都能运行成功,cuda版本是11.2,请问你解决了吗
Swordfish1990 commented
抱歉,时间过去太久,怎么解决的忘记了。我应该是升级了相关软件的版本,现在torch1.12.1、cuda11.6、gcc9.4.0,编译DCN后运行正常。
你好,我是在convert_to_onnx.py中报了这个错误,然而我在其他训练和测试的代码都能运行成功,cuda版本是11.2,请问你解决了吗