THUDM/GLM

GLM (General Language Model)

PythonMIT

Issues

glm-large-chinese-335M重复生成
#154 opened a year ago
3
使用 kubeflow 启动分布式训练
#153 opened a year ago
0
请问GLM_large_chinese的预训练语料在哪里找
#152 opened a year ago
0
请问10B-chinese的模型文件里为什么没有词表？
#151 opened a year ago
1
Accelerate support for GLM
#150 opened a year ago
0
将GLM-10B-chinese模型切分为MP_SIZE=8, 然后finetune seq2seq任务时，在eval阶段报错IndexError。怀疑eval没有以MP_SIZE=8方式运行
#149 opened a year ago
7
你好，我在使用glm-10-chinese对自己数据集进行微调的时候，卡在了第1000个iteration不动了
#148 opened a year ago
5
使用GLM-10B-Chinese模型跑seq2seq的finetune脚本报错word_embeddings.weight维度不对
#147 opened a year ago
1
请问单机8卡v100 32G能跑seq2seq的fine tune吗？我跑着会work = _default_pg.barrier()
#146 opened a year ago
0
使用p-tuning去finetune glm-large-chinese模型时 --continuous-prompt
#145 opened a year ago
3
RuntimeError: expand(torch.HalfTensor{[1025, 4096]}, size=[1]): the number of sizes provided (1) must be greater or equal to the number of dimensions in the tensor (2)
#144 opened a year ago
2
如何通过huggingface加载的模型拿到last_hidden_states？
#143 opened a year ago
0
accelerate 找不到模型
#142 opened a year ago
7
GLM-10B 模型效率问题
#141 opened a year ago
0
BUG: GLM-10B-Chinese model generate " ⁇".
#140 opened a year ago
3
基于Prompt数据集如何微调模型？
#139 opened 2 years ago
0
How to set hyperparameters during pretraining glm_doc?
#138 opened 2 years ago
0
模型并行训练结束后，如何将多个模型文件合并成一个？
#137 opened 2 years ago
2
基于10B模型继续预训练，遇到world size 不一致导致报错
#136 opened 2 years ago
2
cmrc数据集结果，预测结果都为空
#135 opened 2 years ago
0
chatglm-6b
#134 opened 2 years ago
1
单卡pretrain chinese-large模型
#133 opened 2 years ago
0
impelement by megengine
#132 opened 2 years ago
0
hugging face仓库的10b-chinese模型问题。用Trainer API进行数据并行微调会报出OOM错误，有没有优化内存的方法？
#131 opened 2 years ago
3
GLM 10B 模型零样本结果无法对齐
#130 opened 2 years ago
0
The attention mask and the pad token id were not set问题
#128 opened 2 years ago
1
Does this model support temperature and repetition_penalty?
#126 opened 2 years ago
0
GPT2Dataset和BlockDataset
#125 opened 2 years ago
0
小数据finetune large-chinese rouge 为0
#124 opened 2 years ago
2
160G内存，两张24G3090，800G硬盘的环境下，对GLM-10-chinese进行finetune
#123 opened 2 years ago
3
50035 token id 报错
#122 opened 2 years ago
1
如何使用onnxruntime 支持glm优化
#121 opened 2 years ago
0
GLMForSequenceClassification的使用
#120 opened 2 years ago
2
AutoModelForCausalLM
#119 opened 2 years ago
1
bash evaluate_lm.sh问题
#118 opened 2 years ago
0
GPU_id设置
#117 opened 2 years ago
0
generate_samples.py问题
#116 opened 2 years ago
0
模型微调
#115 opened 2 years ago
0
模型微调
#114 opened 2 years ago
1
在测试lambada时报错，显示参数错误，分布式错误
#113 opened 2 years ago
0
利用huggingface glm-10b-chinese模型，跑huggingface上面的例子
#112 opened 2 years ago
2
run ds_pretrain_nvidia.sh
#111 opened 2 years ago
2
怎么使用batch beam search
#110 opened 2 years ago
4
genrate_sample.py的问题
#109 opened 2 years ago
1
`glm-10b-chinese` `build_inputs_for_generation` missing `targets` argument
#108 opened 2 years ago
1
finetuing MP_SIZE问题
#107 opened 2 years ago
1
scripts目录下是缺少一个ds_config.json吗
#106 opened 2 years ago
0
The attention_mask dimension not right？
#105 opened 2 years ago
1
dockerfile中的ssh-env-config.sh文件怎么配置
#104 opened 2 years ago
2
customization dataset在fine-tune和inference的输入不同。
#103 opened 2 years ago
1