leafqycc/rknn-cpp-Multithreading

加速的原理

Sujie1528 opened this issue · 1 comments

大佬可以解释一下线程池加速推理的原理吗?这个方法对所有模型都适用吗?如果一个现有transformer模型单帧推理需要400ms,使用线程池对加速会有帮助吗?感谢!

大佬可以解释一下线程池加速推理的原理吗?这个方法对所有模型都适用吗?如果一个现有transformer模型单帧推理需要400ms,使用线程池对加速会有帮助吗?感谢!

NPU支持并发/并行推理,使用线程池去进行并发推理可以提高NPU的资源利用率(大多数情况下NPU占用都是处于一个不高的状态),进而达到"加速"的效果,
理论上来说对于所有模型都是适用的,加速的效果可以查看NPU当前的使用率去倒推,受限于CPU性能,达到边际效应后提升的效果反而会不明显