dvlab-research/LongLoRA

模型完全没法正常输出

Tangent-90C opened this issue · 1 comments

我连续试了3个LongLoRA微调出的模型

  • LongAlpaca-7B
  • Llama-2-7b-longlora-100k-ft
  • Llama-2-7b-longlora-32k

这3个模型都没法正常输出(直接返回空结果 或 大段重复胡言乱语),不论是用transformers框架推理,还是运行该repo的demo.py都没法work。

image

image

把环境重装之后就解决了