手动修改ChineseCLIPVisionModel to ChineseCLIPVisionModelWithProjection 失败。

Question

Opened this issue 6 months ago · 1 comments

import torch
import torch.nn as nn

visual_projection = nn.Linear(768, 512, bias=False)
embeds = visual_projection(pooled_output)
我人为添加了一个映射层，发现和ChineseCLIPModel求出来的编码不一样。

Answer 1 · 2024-06-26T16:41:00.000Z

应该是预训练参数的问题，但是为啥只提供没有projection的版本呢