YuchenLiu98/COMM

Pytorch code for paper From CLIP to DINO: Visual Encoders Shout in Multi-modal Large Language Models

MIT

Readme
5Issues
178Stargazers
19Watchers

Watchers

dnth
@zenml-io
dydxdt
gisbi-kim
NAVER LABS
Haotian-Zhang
Apple AI/ML
hikame
hkf
isaacperez
itruonghai
University of Science
JiazhengChai
Japan
liuguoyou
LiWentomng
Zhejiang University
lj163ucas
mu-cai
University of Wisconsin - Madison
pengyulong
RenShuhuai-Andy
Peking University
wx-b
RIOS
ytaek-oh
KAIST
YuchenLiu98
SJTU
yuw-nv
Nvidia

Contact site admin: Geeks.