Report Bug in cross-model transfer

Question

Report Bug in cross-model transfer

Celine-hxy opened this issue 2 years ago · 2 comments

crossPrompt.py line317
mask_logits = logits[:, 0] should be modified to mask_logits = logits[:, 100] because there are 100 prompt tokens in the front.

Answer 1 · 2022-10-02T11:50:51.000Z

crossPromptT5.py line 96~98:
self.encoder.prompt_embeddings.weight.data = target_prompt
self.encoder.encoder.prompt_tokens.weight.data = target_prompt
self.encoder.decoder.prompt_tokens.weight.data = target_prompt
Assigning weights in this way will result in grad_ fn lost. Hence gradient cannot be backpropagated.

Answer 2 · 2023-07-01T11:42:29.000Z

@Celine-hxy these bugs are already fixed.