QwenLM/Qwen

The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

PythonApache-2.0

Pinned issues

For issues releated to Qwen1.5, please report to https://github.com/QwenLM/Qwen1.5

#1097 opened a month ago by jklj077

Closed0

Issues

请问可以使用高通的npu进行部署和推理吗？
#1240 opened 11 days ago by caramel678
1
[BUG] <title>执行eval中的eval_plugin进行评测有一个agent从huggingface_hub拉包错误
#1239 opened 11 days ago by Plutowithcharon
1
File "finetune.py", line 412, in <module> train() File "finetune.py", line 384, in train model = get_peft_model(model, lora_config) File "/opt/conda/envs/qwen/lib/python3.8/site-packages/peft/mapping.py", line 123, in get_peft_model peft_config.base_model_name_or_path = model.__dict__.get("name_or_path", None) AttributeError: 'NoneType' object has no attribute '__dict__'[BUG] <title>
#1248 opened 11 days ago by sunyclj
2
[BUG] <Qwen-14B-Chat 输入长文本时无输出结果>
#1232 opened 11 days ago by TianWuYuJiangHenShou
5
微调完成后使用llama_factory的vllm和qwen官方的vllm部署方式启动返回的不一样
#1241 opened 11 days ago by lxb0425
2
本地部署后，运行很慢啊
#1245 opened 11 days ago by wangwm
4
qwen 14b 不微调的情况下，问相同的问题，模型输出也不太一致，是为什么？温度已经设置成0了
#1249 opened 11 days ago by Wangqi12138
2
[BUG] <title>lora微调loss异常？
#1214 opened 2 months ago by estuday
7
💡 [REQUEST] - <title> 关于lora 模型合并的几个问题
#1226 opened a month ago by wangyao123456a
3
[BUG] <title> 如何用vllm部署qlora后的模型
#1197 opened 2 months ago by KevinFan0
2
Qwen/eval中的评测CEval和CMMLU，开大推理的batchsize评测指标会显著降低
#1223 opened a month ago by ntz2000
1
[BUG] lora微调后,合并成一个模型。这种方式如何加载且推理
#1220 opened 2 months ago by wangyao123456a
4
pip install csrc/layer_norm 不成功
#1208 opened 2 months ago by niykx
2
如何添加`LogitsProcessor`控制结果输出？
#1213 opened 2 months ago by ChamfersChen
1
[BUG] <title>torch.cuda.OutOfMemoryError: CUDA out of memory.
#1250 opened 19 days ago by Kaizan-wyl
1
请问下 2.5什么时候开源呀？
#1246 opened 22 days ago by xiguadong
1
[HELP] I wonder how the MMLU result is evaluated?
#1189 opened 21 days ago by YuMeng2v
2
💡 [REQUEST] - <title>数据集构造方法请教
#1191 opened 21 days ago by skyantao
1
多卡并行微调卡住
#1183 opened 23 days ago by HooRin
4
[BUG] <title>fastchat + vLLM +OpenAI API 调用qwen模型，数据不需要预先处理吗
#1244 opened 23 days ago by wangyao123456a
1
💡 [REQUEST] - <使用ollama来调用qwen：14B时，怎么设置输出文本长度呢>
#1243 opened 24 days ago by chaoskklt
1
tokenizer.decoder 抛出'utf-8' codec can't decode bytes in position 1-2: unexpected end of data异常
#1218 opened a month ago by gaokao123
2
请问哪里可以找到qwen用于vllm的jinja template?
#1236 opened a month ago by xudong2019
1
[BUG] Function Calling 示例有错误，最新的 openai sdk 运行时提示 api 已经废弃
#1234 opened a month ago by henryyan
1
[BUG] <title>batch_infer报错：'tuple' object has no attribute 'dtype'
#1210 opened 2 months ago by PineappleWill
2
[BUG] <关于model.generate时发现的源码错误>
#1231 opened a month ago by malidong521
2
请问基于qwen-72b-chat，基于怎样的配置可以在一台4090上训练起来？
#1224 opened a month ago by taishan1994
4
[BUG] Qwen/Qwen-72B-Chat-Int8，不能多GPU并行计算
#1222 opened a month ago by gquanma
1
[BUG] <title> wrong system prompt check?
#1209 opened a month ago by XpastaX
2
以lora、bfloat16方式微调模型，模型微调后采用lora参数和基座模型进行推理，使用merge_and_unload()类前后推理结果不一致，为什么会出现这种情况呢
#1168 opened 2 months ago by shaojh1
2
how to convert qwen.tiktoken to tokenzier.model
#1204 opened 2 months ago by cloudyuyuyu
1
[BUG] .CalledProcessError: Command '['/usr/bin/gcc', '/tmp/tmpecd6su1w/main.c'
#1199 opened 2 months ago by ff1Zzd
3
[BUG] CUDA Error: invalid device function /tmp/pip-req-build-5rlg4jgm/ln_fwd_kernels.cuh 236
#1198 opened 2 months ago by taoqinghua
4
Run Qwen /openai_api.py, Error :Input should be a valid string, body.messages[3].function_call，请问Qwen1.5不支持了么？
#1205 opened 2 months ago by goqw
1
指定了模型地址，还是提示 Incorrect path_or_model_id: '/data/shared/Qwen/Qwen-Chat/'
#1196 opened 2 months ago by 564142183
0
openai_api.py启动的时候添加了username/password, 然后调用的时候怎么传入username/password呢？
#1190 opened 2 months ago by zengqingfu1442
1
[BUG] <title> code_interpreter 生成的图像只能生成到阿里云上么，不能不传到云上，只在本地保存么？
#1193 opened 2 months ago by cheng18175030250
2
请教，qlora微调没效果
#1188 opened 2 months ago by huangyunxin
1
May I ask when Lisa fine-tuning is supported?
#1187 opened 2 months ago by zhaoyinjiang9825
1
微调过程中的taskType参数
#1186 opened 2 months ago by 12915494174
1
[BUG] <title>cannot import name 'allow_in_graph' from partially initialized module 'torch._dynamo' (most likely due to a circular import) (/demo/miniconda3/envs/qwen/lib/python3.9/site-packages/torch/_dynamo/__init__.py)
#1173 opened 2 months ago by dshwei
1
在使用多卡做Qwen-7B-Chat做微调过程中出现ValueError: Expected a string path to an existing deepspeed config, or a dictionary, or a base64 encoded string. Received: finetune/ds_config_zero3.json
#1171 opened 2 months ago by TuDaCheng
1
7B模型推理时生成非有效的idx，应该怎么处理？
#1174 opened 2 months ago by AACengineer
1
[BUG] 对qwen-7b模型微调后，输出句子断句不正常，直接从句子中间停止
#1178 opened 2 months ago by twwch
5
Calculate language probabilities
#1180 opened 2 months ago by itlittlekou
1
4张卡为什么没有并发推理
#1179 opened 2 months ago by linzm1007
5
请问计划什么时间支持让vllm-gptq运行Qwen-72B-Chat-INT8大模型？
#1176 opened 2 months ago by linklogis-copilot
2
deepspeed 单机多卡训练报错
#1175 opened 2 months ago by GXKIM
6
qwen-14B-chat-int8/4 vllm模式部署错误：no kernel image is available for execution on the device
#1169 opened 2 months ago by Lzzycola
1
損失函數計算(評估)方式
#1167 opened 2 months ago by swilly0906
1