使用siglip替换clip 训练时会出现问题
Closed this issue · 3 comments
AIaimuti commented
yfzhang114 commented
大概率是position embedding的维度不对的问题,这一行定义了position embedding的大小,你也可以直接把position embedding comment掉,看看是不是会出问题,这块对最终性能的影响不会特别大
AIaimuti commented
yfzhang114 commented
这是comment的这一段是因为global特征和local特征需要的position embedding不一样,所以需要特别判断一下,只要代码能正常跑通说明就没什么问题。