HikariTJU/LD

如何对yolox进行知识蒸馏

Opened this issue · 6 comments

我看config里面没有yolox的,如果我想对yolox进行蒸馏是不是需要仿照着写一个配置文件

除了配置文件,还要写head和detector

好的谢谢

Qia98 commented

请问单阶段网络(如config里面的YOLOv3)的蒸馏策略是怎么样的?teacher和student如何选取?以及损失函数如何处理?

我们没做yolov3
有retina gfl atss

@nieweiqiang 与RetinaNet类似,teacher的AP比student大2~5个点就行了。LD loss就是师生概率分布的KL loss,weight与regression loss用一样的

请问有实现了在yolox上蒸馏成功的案例吗?有问题想请教一下