leafqycc/rknn-cpp-Multithreading

如何设置源码中的TPEs才是正确的?

lmw0320 opened this issue · 1 comments

我直接用的这个源码,调用我这边的海康摄像头(也就是代码只改动了cv2.VideoCapture处),然后加了推理处的时间耗时检测,发现:

  1. 如果设置TPEs为3左右,每帧推理耗时约30ms;
  2. 如果设置TPEs为10,每帧推理耗时变长,达到60ms;----如果TPEs设为20,则每帧推理耗时则加大到100ms左右?
    按照源码的注释说明,不是加大会提高帧率么??
    我试了下,不论TPEs设置多大,npu利用率每核基本只达到15%左右。

是我哪里没做对么??

我直接用的这个源码,调用我这边的海康摄像头(也就是代码只改动了cv2.VideoCapture处),然后加了推理处的时间耗时检测,发现:

  1. 如果设置TPEs为3左右,每帧推理耗时约30ms;
  2. 如果设置TPEs为10,每帧推理耗时变长,达到60ms;----如果TPEs设为20,则每帧推理耗时则加大到100ms左右?
    按照源码的注释说明,不是加大会提高帧率么??
    我试了下,不论TPEs设置多大,npu利用率每核基本只达到15%左右。

是我哪里没做对么??

您在运行的时候可以看看npu利用率,实际上三个线程基本上就可以吃满大部分npu资源,再往上的边际效应就会很明显。至于npu利用率低应该是驱动问题,此仓库运行在1.5.2版本,您可以尝试换一下Linux镜像或者自行适配1.6.0版本