OFA-Sys/Chinese-CLIP

手动修改ChineseCLIPVisionModel to ChineseCLIPVisionModelWithProjection 失败。

Opened this issue · 1 comments

import torch
import torch.nn as nn

visual_projection = nn.Linear(768, 512, bias=False)
embeds = visual_projection(pooled_output)
我人为添加了一个映射层,发现和ChineseCLIPModel求出来的编码不一样。

应该是预训练参数的问题,但是为啥只提供 没有projection的版本呢