Reproduce LD in yolov8?

Question

Reproduce LD in yolov8?

Opened this issue 2 years ago · 12 comments

感谢您的工作，在这里我有几个问题想和您交流以下：
①我目前在yolov8上采用VOC数据集分别训练学生和老师模型，分别选择pos位置的cls和reg distribution分别为main kd,main ld，如果按照原论文设置会导致kd loss特别大，因此我设置kd参数为weight: 0.25,T=2,ld依然是0.25，T10，模型只涨了0.6%
②yolov8由于适用TAL，对于valuable region loss不太好选择
问题1我尝试调了几次参数就是不太work
请问大佬有啥意见吗

Answer 1 · 2023-03-07T06:51:10.000Z

大佬，最近又反复调了下，之前选择学生模型并没有学习能力，现在换了大一点模型，目前是涨一个点，发现一个奇怪的问题，学生模型太关注老师模型的精准度，召回率我这边考虑将剩下的负样本带进去蒸馏看看，不知道还有哪些可借鉴

Answer 2 · 2023-03-07T06:56:33.000Z

试下coco， VOC本身在我们的实验里提升就不是很大
脱离科研太久了没怎么看新论文，TAL是什么？一种类似ATSS的Assign方式吗，如果是Assigner,那不就应该有正负样本么？
你说的可借鉴是指什么？

Answer 3 · 2023-03-07T07:09:59.000Z

好的我准备在VOC试了有效再搞COCO，tal是正负样本匹配的方式主要没有阈值概念，可能时半会还没有想出获取valuable negtive region办法，我们只蒸馏正样本区域，并没有考虑到怎么召回更多的围绕再gt周围的anchor

Answer 4 · 2023-03-07T07:35:23.000Z

有一个东西叫minicoco，训练也挺快的。VOC和COCO很有可能最佳的参数不一样，导致最后还是需要在coco调参
最简单的办法是用全部的负样本，也就是下图=0的情况，也能有不少的提升

PS: 说一个无关的小技巧：蒸馏的时候把DFL关了可能会有惊喜

Answer 5 · 2023-03-07T07:41:07.000Z

hhh 这么刺激，我试一下

Answer 6 · 2023-03-10T07:03:30.000Z

大佬，我最近复现特征蒸馏非常不顺利（yolov8上），能加个微信聊聊吗，我发过您邮箱

Answer 7 · 2023-03-10T07:23:27.000Z

没收到你的邮件， 2668129173是你的qq吗

Answer 8 · 2023-03-10T08:04:45.000Z

大佬有空的适合加一下，我的微信号wangtao2668129173

Answer 9 · 2023-09-04T05:31:43.000Z

大佬我最近也在v8上搞蒸馏，能否参考下是如何添加蒸馏部分的代码

Answer 10 · 2023-12-02T14:50:29.000Z

@wangtao2668129173 大佬，您现在yolov8蒸馏搞得咋样，想跟您学习下

Answer 11 · 2023-12-05T05:47:46.000Z

@wangtao2668129173 大佬，您现在yolov8蒸馏搞得咋样，想跟您学习下
实验结果在VOC 数据集非常有效，但是coco 只对精准度有用，整体指标提升没有VOC明显。还有就是目前yolov8 检测器参数量比起mmdetection 检测模型还不太够，能起效的方法其实并不多。以及rtmdet 、damoyolo 有些蒸馏方法为啥起效其实迁移到yolov8基本上会不起效，这里面我觉得是哪些前提鲜有人闻。总之，检测蒸馏有好用的论文，欢迎大家都推一推，目前检测蒸馏现有方法都不太理想。

Answer 12 · 2023-12-05T06:00:45.000Z

@wangtao2668129173 大佬，您现在yolov8蒸馏搞得咋样，想跟您学习下
实验结果在VOC 数据集非常有效，但是coco 只对精准度有用，整体指标提升没有VOC明显。还有就是目前yolov8 检测器参数量比起mmdetection 检测模型还不太够，能起效的方法其实并不多。以及rtmdet 、damoyolo 有些蒸馏方法为啥起效其实迁移到yolov8基本上会不起效，这里面我觉得是哪些前提鲜有人闻。总之，检测蒸馏有好用的论文，欢迎大家都推一推，目前检测蒸馏现有方法都不太理想。

大佬我加你微信了