Tlntin/Qwen-TensorRT-LLM

PythonMIT

Issues

可以在QWen-72b-Chat Int4上跑吗
#41 opened 7 months ago
2
AWQ现在还不支持张量并行吗？tp_size=4，不成功
#40 opened 7 months ago
4
长序列（>2048)出现output为空
#39 opened 6 months ago
7
有支持llava转换的计划吗
#38 opened 7 months ago
1
支持Qwen-14b吗？
#37 opened 7 months ago
1
Question: 关于 gptq 和 awq 某个 bug fix 的效果
#36 opened 7 months ago
1
如何使用qwen/run.py批量获取到一批query的模型output？
#35 opened 7 months ago
0
使用Langchain-Chatchat出现的问题：Did not find openai_api_key, please add an environment variable `OPENAI_API_KEY` which contains it
#34 opened 7 months ago
10
请问如何支持 qwen-14b-chat-int4
#33 opened 7 months ago
3
关于TensorRT-LLM接入LangChain
#32 opened 8 months ago
16
关于TensorRT-LLM接入LangChain
#31 opened 8 months ago
1
显存占用
#30 opened 7 months ago
1
咨询个关于中间产物的问题
#29 opened 7 months ago
3
2080ti (22g) 执行int4 gptq转换报错
#28 opened 8 months ago
12
部署api和尝试网页对话出现的bug
#27 opened 8 months ago
3
AttributeError: 'QWenConfig' object has no attribute 'intermediate_size'
#25 opened 8 months ago
4
14B-4bit对应的web-demo.py的奇怪bug，重复输出。
#24 opened 8 months ago
2
3090上qwen-14b-4bit转换失败
#23 opened 8 months ago
4
Got slower speed using smooth quant
#22 opened 8 months ago
8
能支持qwen-vl吗？
#21 opened 6 months ago
4
Support int4 gptq and awq quantization?
#20 opened 7 months ago
3
配套视频（免费|连载中）
#19 opened 7 months ago
0
qwen14bchat int4转换后输出异常
#18 opened 8 months ago
13
For Nvidia GPU, does it support Nvidia GPUs with compute capability 6.0, e.g., P100?
#17 opened 8 months ago
2
RuntimeError: [TensorRT-LLM][ERROR] Assertion failed: Unsupported Arch (/opt/tritonserver/TensorRT-LLM/cpp/tensorrt_llm/kernels/cutlass_kernels/cutlass_preprocessors.cpp:147)
#15 opened 8 months ago
5
能导出镜像吗？
#14 opened 8 months ago
13
关于paged_kv_cache的疑问？
#13 opened 8 months ago
2
请问支持In-flight Batching吗？
#12 opened 8 months ago
20
请问有人跑通过14B么？
#11 opened 8 months ago
1
目前qwen不支持张量并行？
#10 opened 8 months ago
4
启动build时调用了Hugging face了吗？
#9 opened 8 months ago
7
测试问题
#7 opened 8 months ago
6
镜像编译失败：
#6 opened 8 months ago
10
大佬，为啥官方支持模型列表里面没有qwen呀
#5 opened 8 months ago
1
编译安装镜像时候，报错。
#4 opened 8 months ago
1
运行qwen/run.py报错，libnvinfer_plugin_tensorrt_llm.so: cannot open shared object file: No such file or directory
#3 opened 8 months ago
1
TRT_LLM web_demo演示
#2 opened 8 months ago
0
大佬，有个关于镜像的问题想要请教
#1 opened 8 months ago
1