shibing624/MedicalGPT

MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型，实现了包括增量预训练(PT)、有监督微调(SFT)、RLHF、DPO、ORPO。

PythonApache-2.0

Pinned issues

sft微调chatglm2，合并时报错

#68 opened a year ago by shawnlihst

Closed3

请教增量预训练后的两个问题：1）token长尾 2）group texts

#83 opened 8 months ago by Zagreus-lzy

Closed10

ChatGLM全参数二次预训练过程中，loss马上变为0，val_loss = nan

#125 opened 10 months ago by gloryyoung

Closed13

Issues

ValueError: Please specify target_modules in peft_config
#379 opened 10 days ago by lyj-newbie
1
关于llama3的权重转换
#378 opened 15 days ago by tszslovewanpu
1
医学大模型全流程体验
#377 opened 21 days ago by YoshuaBengio
2
DPO训练，报错：“IndexError: Invalid key: 0 is out of bounds for size 0”
#375 opened 24 days ago by dage0127
2
ppo训练时出现问题：UserWarning: KL divergence is starting to become negative: -233.50
#374 opened a month ago by user2311717757
2
运行pretraining.py时报错：RuntimeError: CUDA error: device-side assert triggered
#376 opened 25 days ago by Wenting1227
4
vocab扩展后的模型合并问题
#373 opened a month ago by sungatetop
1
有没有人能分享下自己微调后的模型id，我懒得弄，只想吃现成的
#372 opened a month ago by aqpmzngldh
1
AMD 执行 run_pt.sh失败
#371 opened a month ago by liuyang6055
1
关于提前结束训练
#368 opened a month ago by tszslovewanpu
4
orpo脚本NoneType问题
#363 opened 2 months ago by songyao199681
6
预训练后模型出现自问自答、输出未知序列、重复口吃现象
#351 opened 3 months ago by Peter-of-Astora
6
dpo_training.py eal存在空的情况
#369 opened a month ago by 14686039
2
UserWarning: None of the inputs have requires_grad=True. Gradients will be None
#359 opened 2 months ago by cove1011
2
几步的训练怎么都是独立的，rm都没用sft的adapter
#365 opened 2 months ago by cqray1990
1
对chat模型进行二次预训练后，自问自答
#366 opened 2 months ago by wsl1014
1
训练reward_modeling.py
#364 opened 2 months ago by cqray1990
1
reward_modeling咨询
#361 opened 2 months ago by tuqingwen
1
Regarding RLHF and DPO training data
#358 opened 2 months ago by Aniketto16
2
dpo训练出错
#342 opened 3 months ago by cove1011
5
运行inference.py文件，报AttributeError: property 'eos_token' of 'ChatGLMTokenizer' object has no setter
#353 opened 2 months ago by liulint
1
使用deepspeed 全参数sft后，inference 回答的都为空，有解决办法吗
#357 opened 2 months ago by Yian320
2
全参数SFT后无法正常infer
#331 opened 4 months ago by nuoma
3
ValueError: operands could not be broadcast together with remapped shapes [original->remapped]: (3,2) and requested shape (1,2)
#356 opened 2 months ago by Riapy
1
lora模型合并
#355 opened 3 months ago by sevenandseven
2
扩充词表后能否直接进行SFT呢？
#352 opened 3 months ago by HaotianLiu123
0
assert tokenzier_vocab_size > model_vocab_size
#350 opened 3 months ago by sevenandseven
5
增量预训练效果评估
#349 opened 3 months ago by qibao77
1
llama进行rm训练的时候，出现问题ValueError: weight is on the meta device, we need a `value` to put in on cpu.
#347 opened 3 months ago by cove1011
1
关于Chatglm3的增量预训练
#348 opened 3 months ago by XueMoonLit
1
使用qwen进行pretrain的时候出现了问题：Cannot copy out of meta tensor; no data!
#346 opened 3 months ago by cove1011
1
ValueError: The model does not have a language model head, please use a model that has one.
#345 opened 3 months ago by cove1011
1
chatglm2-6b预训练合并权重后，推理加载，AttributeError: can't set attribute
#332 opened 3 months ago by weedon666
2
chatglm2合并sft_qlora后，推理出现自动续答
#339 opened 3 months ago by Lxhnnn
3
ChatGLMForSequenceClassification rm步骤出错
#341 opened 3 months ago by cove1011
1
TypeError: ChatGLMForSequenceClassification.forward() got an unexpected keyword argument 'output_attentions'
#343 opened 3 months ago by cove1011
0
chatglm3训练在rm之后，进行lora模型权重合并到base model，出现问题：ValueError: chatglm does not support sequence classification
#344 opened 3 months ago by cove1011
2
单机多卡sft deepspeed zero3 训练一直卡在训练阶段
#330 opened 4 months ago by lainxx
1
DPO阶段报错
#334 opened 3 months ago by small-white-zs
5
Please provide an offload_folder
#335 opened 3 months ago by cove1011
1
请问这是什么oserror
#337 opened 3 months ago by cove1011
3
全量预训练baichuan-7b Out of memory
#338 opened 3 months ago by FFFFFzx
3
dpo_training训练chatglm3-6b模型报错。
#340 opened 3 months ago by xiaochaich
1
大佬好，请教几个模型训练问题
#336 opened 3 months ago by xxyp
2
训练完之后保存的时候出现无法连接,requests.exceptions.ConnectionError: (MaxRetryError("HTTPSConnectionPool(host='huggingface.co', port=443
#333 opened 3 months ago by josangmi
2
预训练报错，之前有正常跑成功过，现在报这个错误，有人遇到过吗？谢谢啦
#326 opened 3 months ago by zxx20231119
2
Question about hardware requirements - 关于硬件要求的问题
#325 opened 4 months ago by elieobeid7
4
问题 flashattention
#329 opened 4 months ago by wuguangshuo
1
这个错误是因为训练的单条数据太长了吗？截断是不是修改配置就可以了？
#328 opened 4 months ago by zxx20231119
3
SFT微调报错
#327 opened 4 months ago by ZhuangXialie
1