QwenLM/Qwen-Audio

The official repo of Qwen-Audio (通义千问-Audio) chat & pretrained large audio language model proposed by Alibaba Cloud.

PythonNOASSERTION

Issues

如何返回ASR识别文本？
#78 opened a month ago by litao09h
0
Qwen-Audio给的示例Demo输入本地音频文件没有跑出转写的文本结果？能提供相应的例子吗
#23 opened a year ago by apple2333cream
4
如何进行AudioCaption任务
#77 opened 2 months ago by gaochangfeng
0
Compute Requirements and Execution Time
#76 opened 3 months ago by Sedherthe
1
请问有计划接入TTS模块吗
#74 opened 4 months ago by CD678
0
有onnx格式的模型吗
#56 opened 8 months ago by whk6688
2
是不支持中文提示词吗
#53 opened 8 months ago by GioGioBond
1
微信群满了
#69 opened 6 months ago by qgzang
5
问题请教，关于gradio的问题，我在本地部署好了，想在手机上使用，显示找不到麦克风
#28 opened a year ago by cl886699
1
请问Qwen-audio的训练速度，阿里官方达到多少？
#46 opened 10 months ago by luboxu
1
能否获得hidden表示？
#63 opened 6 months ago by Kristopher-Chen
1
在rustc 1.80.1编译tokenizers v0.13.3报错
#72 opened 5 months ago by martinzh717
0
qwen-audio处理长音频（五分钟左右）结果只输出前面20秒的文本是什么原因？
#34 opened a year ago by Wolverhampton0
9
可以问一下微调代码的公开的计划嘛？预计什么时候能开源呢？非常感谢！！！
#40 opened 10 months ago by icemoon-creative
2
训练超参数相关问题
#51 opened 9 months ago by jwang1993
1
关于粤语支持
#45 opened 10 months ago by lq0104
1
Get token in predict ?
#71 opened 5 months ago by CungNguyenHuy
0
cuda版本错误
#70 opened 5 months ago by ZHUHF123
0
Clarification | Datasets used for training.
#65 opened 6 months ago by Iosifts
2
Problems for speech translation tasks
#68 opened 6 months ago by ShoutaoGuo
0
Input multiple audio file to audio encoder
#66 opened 6 months ago by DevKiHyun
0
Evaluation script for VSC task seems not correct
#64 opened 6 months ago by mlxu995
0
微信群满了
#59 opened 8 months ago by adeamoy
1
qwen-audio和lauragpt的相关问题讨论
#62 opened 7 months ago by wwfcnu
0
关于训练数据中不同语言分布情况
#61 opened 7 months ago by shihuai
0
本地部署需要多少算力‘’
#60 opened 7 months ago by Gpwner
0
有量化后的版本吗
#57 opened 8 months ago by whk6688
1
chat模型，相同文本问题，不同音频，每次ASR返回结果都一样
#58 opened 8 months ago by LiXuanming
0
use of whisper audio encoder
#33 opened a year ago by x75
4
how can i chat in demo
#55 opened 8 months ago by lzl-mt
0
复现实验结果有差距
#26 opened a year ago by roydcai
2
请问是否支持 VLLM 等api部署
#52 opened 9 months ago by su-zelong
1
微信群满了
#49 opened 9 months ago by zhangfan-algo
0
allow_pickle=False
#48 opened 9 months ago by Leejl0011
2
wechat full
#36 opened a year ago by lixf071213
4
支持本地api调用吗？
#47 opened 10 months ago by dfengpo
0
qwen-audio 微调
#38 opened a year ago by wjfwjfwjf
2
Few-shot Examples
#44 opened 10 months ago by aqibsaeed
0
请问prompt要怎么写才能获得单个task的信息或者想要的task的信息？
#32 opened 10 months ago by wjyfelicity
2
确定给的本地模型没问题吗
#41 opened 10 months ago by wukongbuku
0
Infer eval_audio目录下的multi-task eval脚本，发现模型针对batch 解码性能衰减很快，请问是训练时候attention mask 或者tokenizer padding部分处理有问题吗？
#43 opened 10 months ago by yangjiabupt
0
报错，requests.exceptions.HTTPError: Response details: 404 page not found, Request id: ab8a478639c847c6bbb41438e4d8606e
#42 opened 10 months ago by wukongbuku
0
End of sentence id
#35 opened a year ago by marcoyang1998
0
关于Output Instruction的问题
#31 opened a year ago by jwang1993
1
是否考虑加入whisper.cpp的支持？
#30 opened a year ago by dyt06
0
关于训练数据问题
#29 opened a year ago by qy-NJU
0
Tokenizer vocab size mismatch model vocab size
#27 opened a year ago by yangjiabupt
0
SFT use lora? or finetune all parameters?
#24 opened a year ago by yangjiabupt
2
The number of people in the WeChat group is full. Can you update the WeChat group QR code?
#25 opened a year ago by rookie0607
1
ground
#22 opened a year ago by wntg
0