THUDM/ChatGLM3

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

PythonApache-2.0

Pinned issues

这些问题不要在Issue提出，在Discussion中提出

#394 opened 7 months ago by zRzRzRzRzRzRzR

Open22

Issues

导入huggingface_hub不知道那个版本导入库没有后面的 TextGenerationStreamResponse, Token
#1218 opened 12 days ago by lq954359980
9
从 chat 接口内部调用 generate 接口的处理逻辑看，使用上述拼接方式生成的 input_ids 不符合你们对于特殊符（如<|user|>、<|assistant|>）的 id 定义，这部分是否只是为了兼容通用的 generate 接口？且存在对模型性能的损失？
#1256 opened 6 days ago by Tesla-jiang
2
LORA 微调报错
#1242 opened 4 days ago by ZhuXuesong7423
1
运行basic_demo下的web_demo_gradio.py程序报错ModuleNotFoundError: No module named 'peft'
#1253 opened 7 days ago by miracles-zhang
1
使用chatglm.cpp调用chatglm3-6b-32k时，非常容易触发无限循环的问题，repetition_penalty设置为2依然没有效果
#1257 opened 6 days ago by zhoumz123
1
Getting requirements to build wheel did not run successfully.
#1259 opened 5 days ago by therobot1
1
openai_api_request.py运行不成功
#1258 opened 6 days ago by SENVENHUHU
1
api模式下是不能实现工具调用吗？
#1249 opened 8 days ago by 4ooooo
1
langchain_demo中的那个是不是不是流式处理？
#1254 opened 6 days ago by ciaoyizhen
0
ChatGLMForConditionalGeneration forward position_ids 参数哪里传入的？
#1255 opened 7 days ago by cqray1990
0
执行了composition_demo，发现仅仅用了一个cpu去执行推理。速度非常慢。这个是什么原因导致的？
#1252 opened 8 days ago by pengyuxiang1
0
拼接格式与 chat 接口处理逻辑是否冲突
#1238 opened 12 days ago by Tesla-jiang
2
lora微调后没有pytorch_model.bin
#1203 opened 9 days ago by zhengshi119
2
进行p-tuning-v2微调时，报如下错误
#1237 opened 12 days ago by cskaoyan
4
lora微调报错
#1239 opened 14 days ago by xiaohaiqing
1
composite_demo 代码解释器无法生成图片
#1187 opened 12 days ago by Aike505
2
量化加载chatglm3，报错：round_vml_cpu not implemented for Half
#1217 opened 12 days ago by imempty
5
bug when running inference_hf.py after finetuning with lora.
#1243 opened 13 days ago by RemiAlliah
0
RMSNorm的不同实现方式
#1240 opened 14 days ago by trundleyrg
0
启动/openai_api_demo/api_server.py 使用stream 方式请求接口/v1/chat/completions ，时而返回数据，时而不返回数据
#1177 opened 2 months ago by caijx168
3
requirements.txt的问题
#1231 opened 16 days ago by zhfish
1
problems when finetuning with lora
#1232 opened 18 days ago by RemiAlliah
3
【求助】关于算法备案的问题
#1233 opened 18 days ago by bh4ffu
0
AttributeError: 'NoneType' object has no attribute 'peft_type'
#1224 opened 20 days ago by liuqi8827
3
运行抛异常：CUDA error: device-side assert triggered CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1. Compile with TORCH_USE_CUDA_DSA to enable device-side assertions
#1228 opened 22 days ago by hotcolaava
4
api_server.py只能用post请求调用吗
#1204 opened 21 days ago by Yapeng-Gao
2
api调用出错
#1225 opened 21 days ago by llyllu
1
[lora finetune] RuntimeError: CUDA error: device-side assert triggered
#1219 opened 24 days ago by Janet-Baker
0
关于微调多轮对话生成的loss_mask格式问题
#1213 opened a month ago by RyanOvO
1
ptuning_v2 微调后使用inference_hf.py推理出现Both `max_new_tokens` (=512) and `max_length`(=8192) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)
#1215 opened a month ago by 52566rz
3
官方的所有openai_api实现的函数调用全部失效了
#1207 opened a month ago by jnchen
8
openai_api.py 支持并发调用，或者怎么实现并发调用
#1216 opened a month ago by qinzhenyi1314
1
128k的模型使用lora微调后，进行推理的时候卡住怎么回事？
#1181 opened a month ago by dazzlingCn
4
GLM大模型是Causal Language Model类型的模型么？
#1205 opened a month ago by RyanOvO
1
关于多卡部署
#1199 opened a month ago by Anfeather
3
Streamlit 启动 composite_demo后页面加载报错
#1182 opened a month ago by wli173-ford
3
quantization failed
#1197 opened a month ago by qslia
1
单机多卡Lora微调总是出现nccl错误
#1174 opened a month ago by Hxinyue
0
Running Prediction
#1189 opened a month ago by sleep-zzw-bot
5
【已经移动到Discussions】【咨询】Mac 上通过运行python3 web_demo_streamlit.py 会把模型下载到哪里？
#1195 opened a month ago by myEchos
0
chatglm4啥时候开源？
#1193 opened a month ago by njhouse365
1
chatglm-6b库中ptuning/evaluate.sh&main.py可否直接用于chatglm3的LoRA微调的评估
#1188 opened a month ago by CharonsPluto
2
langchain DEMO问题：无法调用tools
#1185 opened a month ago by Lizhli2825
2
ChatGLM3分词器的model.vocab能不能提供一下
#1184 opened a month ago by CNUIGB
1
多卡运行 OMP_NUM_THREADS=1 torchrun --standalone --nnodes=1 --nproc_per_node=8 finetune_hf.py data/AdvertiseGen/ THUDM/chatglm3-6b configs/lora.yaml configs/ds_zero_2.json
#1183 opened a month ago by cqray1990
0
call tool 微调，报错
#1176 opened 2 months ago by koryako
1
请教一下，如何正确的在system pormpt中正确的设置tools的描述，我在举例一个准确的地点时，不想调用查询天气的信息。
#1169 opened 2 months ago by 512625100
3
lora微调后怎么用网页版demo加载微调后的模型
#1172 opened 2 months ago by dasaffa
1
4090显卡使用官方的ptuning_v2.yaml来进行微调时出现显存不足的问题
#1168 opened 2 months ago by Ayanami233e
0
Chatglm3-6b使用官方的ptuning_v2.yaml进行微调，4090显卡报错显存不足
#1166 opened 2 months ago by Ayanami233e
1