puppy2000 opened this issue 7 months ago · 2 comments
我们用的ViT/B作为预训练的backbone,采用MAE作为pretext task。参数量大概在100M+,具体不记得了。
好的谢谢您