MCG-NJU/MixFormerV2

MixFormerV2和MixFormer之间的关系?

Maggie1998 opened this issue · 2 comments

MixFormerV2和MixFormer在模型结构上有哪些相同和不同呢?

最主要的区别是预测head不同,v2不再采用之前的corner head, 而是通过添加4个可学习的token,通过在backbone中跟search和template tokens进行交互提取内容和位置信息,最后直接利用mlp head来预测top bottom left right四个位置。

想请教一下,head在学习的过程中只能通过蒸馏来吗?