hiyouga/LLaMA-Factory

Unify Efficient Fine-Tuning of 100+ LLMs

PythonApache-2.0

Issues

preprocess_supervised_dataset问题
#3749 opened 18 days ago
1
使用 DeepSpeed ZeRO-3 平均分配显存运行一段时间后报 Signal 7 (SIGBUS) received
#3747 opened 3 days ago
3
在训练使用llama2-7b-hf时报错
#3745 opened 18 days ago
1
数据集与训练方法相关问题
#3744 opened 16 days ago
1
什么时候进行微调，什么时候使用RAG呢？
#3743 opened 16 days ago
1
使用zero3, 但模型参数没有分布式
#3742 opened 19 days ago
1
怎么在单机多卡上做”持续预训练“？
#3740 opened 19 days ago
6
多模态模型微调能否支持多轮对话中包含图片输入的数据集？
#3739 opened 16 days ago
2
merge lora权重后的模型无法推理
#3738 opened 3 days ago
0
无法加入微信群
#3737 opened 19 days ago
2
web_demo.sh
#3736 opened 19 days ago
5
请教一下如何在加载模型后实时更新lora？
#3735 opened 3 days ago
3
Agent tuning 多轮会话使用不同的参数连续问相同的话题, 工具识别失败
#3734 opened 3 days ago
0
在单机多卡训练过程结束后，当尝试加载模型以进行对话交互时，模型的响应出现了乱码现象。
#3733 opened 3 days ago
0
改变词表大小无法运行怎么办？
#3732 opened 19 days ago
2
推理遇到数据集加载问题
#3731 opened 9 days ago
2
为什么同样的脚本（Qwen1.5/examples/web_demo.py）去执行Qwen1.5-32B-Chat-GPTQ-Int4的推理时，4090 24G 比 V100 32G 回答速度快了5倍，这是什么原因，是显卡性能的问题，还是代码还有哪个配置没有打开，导致V100的计算能力没有发挥出来？
#3730 opened 20 days ago
1
关于多轮对话的loss计算
#3729 opened 20 days ago
2
执行webui的训练报IndexError: list index out of range
#3728 opened 19 days ago
4
如何只训练前N层而冻结后面的层？
#3727 opened 20 days ago
1
尝试将qwen1.5 14b llamafy后unsloth训练报错
#3726 opened 20 days ago
4
请问现在支持合并llava的lora权重吗
#3725 opened 20 days ago
1
使用longlora在val测试（非训练）时遇到错误：local variable 'groupsz' referenced before assignment
#3724 opened 20 days ago
1
多卡增量训练，数据集处理完后tokenizer都不进行的
#3723 opened 3 days ago
0
使用longlora后，tran_loss稳步减小，eval_loss不断上升
#3722 opened 20 days ago
4
请教下，我在训练IBM开源的code相关的大模型时，提示bias的权重未初始化，请问是什么原因呢？
#3721 opened 20 days ago
1
qwen1.5-7b-chat，使用longlora，按照论文的方案，把norm和emb也加入微调参数，但是报错了 ValueError: Target module Qwen2RMSNorm() is not supported. Currently, only the following modules are supported: `torch.nn.Linear`, `torch.nn.Embedding`, `torch.nn.Conv2d`, `transformers.pytorch_utils.Conv1D`.
#3720 opened 20 days ago
1
点击“开始”训练模型报错：训练出错。后台：'llamafactory-cli' 不是内部或外部命令，也不是可运行的程序或批处理文件。
#3719 opened 20 days ago
1
预训练数据，2万条，--max_samples 100000，为什么Num examples = 1,445？
#3718 opened 20 days ago
1
在v100上用vllm推理时报错
#3717 opened 20 days ago
7
How much GPU MEMEORY is needed to train DPO models?
#3716 opened 20 days ago
15
[W socket.cpp:663] [c10d] The client socket has failed to connect to [::ffff:255.255.0.0]:29500 (errno: 110 - Connection timed out).
#3715 opened 20 days ago
1
请问下 intel ultra系列的NPU 可以使用吗？
#3714 opened 20 days ago
1
微调后输出正确答案后胡言乱语
#3713 opened 20 days ago
2
全参微调退出异常问题
#3712 opened 3 days ago
1
Gradio version too high for web demo that css faild for CORS
#3711 opened 20 days ago
2
多卡lora微调llama3如何合并
#3710 opened 20 days ago
1
SFT训练时别的参数都相同，仅ZeRO2和ZeRO3不同，训练时的loss不同，且最后测评结果差距也很大
#3709 opened 20 days ago
4
4张3090lora微调Qwen7B爆显存
#3708 opened 20 days ago
2
Feature request: better support/documentation for dropout during early and/or late training
#3707 opened 20 days ago
1
更新后，导出模型去哪了？
#3706 opened 20 days ago
1
预训练损失函数一直震荡，不收敛
#3705 opened 20 days ago
1
Llama pro , methods: Lora, Stage: orpo ,mudule expansed,did not work as expected ,Model llama3-8B-instruct , finetuned model infers not as well as original model
#3704 opened 20 days ago
4
trainer_log.jsonl 输出不完整？
#3703 opened 20 days ago
1
template 设置为llama3的时候报错，显示: ValueError: Template llama3 does not exist.
#3701 opened 21 days ago
4
图片数据集，images读取文件路径错误
#3700 opened 21 days ago
1
Timeout
#3698 opened 3 days ago
1
关于sft训练的监督问题
#3697 opened 22 days ago
3
Meta-Llama-3-8B全参数继续预训练A800单卡跑不起来
#3696 opened 22 days ago
1
llama3 单机多卡不可训练，exits with return code = -7
#3695 opened 22 days ago
2