GPU利用率低
sunny-sjj opened this issue · 7 comments
sunny-sjj commented
为什么我训练的时候利用率很低呢,我的cuda环境也配置好了
fengyuentau commented
目前I/O方面效率比较低,我们正在处理这个问题。其次模型也比较小,综合导致利用率较低。
训练时添加OMP_NUM_THREADS=2
可提升训练速度,即OMP_NUM_THREADS=2 python train.py
。>=2也可以。
sunny-sjj commented
嗯嗯,好的,谢谢
sunny-sjj commented
我还有个问题想问一下您。在您提供的multibox_loss.py的文件内,在计算eiou_loss的时候: loc_t这个是不是没有给他分配target的值啊。还是我理解的有问题。
fengyuentau commented
这一行的loc_p
是网络的预测值,loc_t
是真实标签。我们用eiou来计算预测框与真实框之间的距离。
sunny-sjj commented
嗯嗯,是的。我理解的是loc_t应该等于这里的truths,但是我在代码中没有看到赋值操作
在代码中local_t只在这里赋值
请问是我的理解有问题吗?谢谢回复
fengyuentau commented
libfacedetection.train/src/multibox_loss.py
Lines 66 to 75 in e72b34b
第74行的match函数负责将anchor和gt匹配,匹配的gt会写入到loc_t
里面(第148行):
libfacedetection.train/src/utils.py
Lines 98 to 151 in e72b34b
sunny-sjj commented
啊啊啊,原来藏在这里,非常感谢您的回复。