kohjingyu/fromage

🧀 Code and models for the ICML 2023 paper "Grounding Language Models to Images for Multimodal Inputs and Outputs".

Jupyter NotebookApache-2.0

Issues

retrieval only mode
#36 opened 2 months ago by oferidan1
1
Can I use the embedding for training
#35 opened 3 months ago by LiJichen0114
2
Evaluation code of VQAv2
#34 opened 7 months ago by Yui010206
0
Freezing the final linear layer when adding new token [RET]
#31 opened 7 months ago by ptirupat
1
torch.distributed.all_gather does not have grads
#33 opened 9 months ago by MrZilinXiao
2
=> no checkpoint found at '=/home/...
#32 opened 9 months ago by eveningwalk
0
I got 'KeyError: 'best_score'' while trying to fine-tuning
#29 opened 9 months ago by kxxseola
7
I got Unexpected key(s) in state_dict error
#30 opened 9 months ago by eveningwalk
2
can you give me a pre-trained weight file not pruning?
#28 opened 10 months ago by seungwoo-Jang
5
What is CC3M Embeddings
#27 opened a year ago by ziqipang
2
[RET] Embedding
#26 opened a year ago by pUmpKin-Co
3
Dealing with Corrupted Images in CC3M
#25 opened a year ago by ziqipang
4
The ability of in-context learning
#24 opened a year ago by yongliang-wu
0
Evaluation code for VQAv2
#23 opened a year ago by ys-zong
4
Computing output likelihoods with the model
#13 opened a year ago by vishaal27
7
Huggingface pipeline
#15 opened a year ago by Marcusntnu
2
The reproduction of FROMAGe training
#22 opened a year ago by Ziyang412
6
The cross entropy loss in training stage
#21 opened a year ago by Ziyang412
2
The evaluation speed of IT2T on VisDial
#20 opened a year ago by Ziyang412
8
Evaluation for VisDial
#19 opened a year ago by Ziyang412
1
Weights of `lm_head` were not frozen during training?
#18 opened a year ago by ys-zong
3
How are the inputs arranged for in-context retrieval evaluation?
#17 opened a year ago by ys-zong
5
Choice of retrieval embedding dimension q = 256
#10 opened a year ago by EIFY
3
How does generate work?
#16 opened a year ago by zhaoshitian
2
Do you think bigscience/bloom can be a replacement of facebook/opt model ?
#7 opened a year ago by svjack
5
What is "fromage_vis4" model?
#8 opened a year ago by ahnjaewoo
3
How to load dataset?
#12 opened a year ago by zhaoshitian
2
Failure in testing the demo
#9 opened a year ago by Yingjia-Wan
1
Hello, I wanna konw the purpose of create_image_of_text
#11 opened a year ago by SZhanZ
2
Question about the frozen language model
#6 opened a year ago by sijeh
2
Should the last_embedding_idx = caption - 2 ?
#4 opened a year ago by sijeh
2
Concatenating two captions in retrieval mode
#5 opened a year ago by jeasinema
6
when the source codes can be released?
#1 opened a year ago by runzeer
3
Asking for roadmap with more details?
#2 opened a year ago by ZeinabTaghavi
1