Coobiw/MPP-LLaVA

Personal Project: MPP-Qwen14B & MPP-Qwen-Next(Multimodal Pipeline Parallel based on Qwen-LM). Support [video/image/multi-image] {sft/conversations}. Don't let the poverty limit your imagination! Train your own 8B/14B LLaVA-training-like MLLM on RTX3090/4090 24GB.

Jupyter Notebook

Pinned issues

Probably lower loss when use `train_pipeline.py`

#22 opened 3 months ago by Coobiw

Closed1

DeepSpeed的PP需要相同的seq-length(collate时注意padding)和batchsize(将dataloader的`drop_last`设为True)

#25 opened 3 months ago by Youngluc

Closed11

DeepSpeed CPU-Offload Optimizer CUDAVersionError

#31 opened 2 months ago by cuczhangyi

Closed4

Issues

DeepSpeed CPU-Offload Optimizer CUDAVersionError
#31 opened 2 months ago by cuczhangyi
4
微调训练视频数据读取问题
#30 opened 3 months ago by wangyin717
1
二阶段微调训练的问题
#29 opened 3 months ago by wangyin717
3
DeepSpeed的PP需要相同的seq-length(collate时注意padding)和batchsize(将dataloader的`drop_last`设为True)
#25 opened 3 months ago by Youngluc
11
logo upload
#28 opened 3 months ago by Coobiw
0
video-chat example 2(language: en)
#27 opened 3 months ago by Coobiw
1
请教一下关于SFT的问题
#26 opened 3 months ago by df2046df
3
AI 无法理解图片
#24 opened 3 months ago by liuling19941216
10
请问如何减少训练时长
#14 opened 3 months ago by xiyuanhao
2
请问是否支持流水线并行推理
#15 opened 3 months ago by valencebond
2
Probably lower loss when use `train_pipeline.py`
#22 opened 3 months ago by Coobiw
1
video-chat example upload
#23 opened 3 months ago by Coobiw
0
分布式设置错误
#19 opened 4 months ago by WeiminLee
1
是否支持QWEN-14B的INT4的量化版本？
#18 opened 5 months ago by yumianhuli2
3
请问如何用Qwen-14B进行重新训练
#11 opened 5 months ago by delltower
3
关于知乎中提到的多模态接入方案问题
#17 opened 5 months ago by cszhengyh
6
special token
#7 opened 5 months ago by PangziZhang523
5
训练loss异常
#5 opened 5 months ago by balabala2023
6
Code confusion
#2 opened 5 months ago by abbhay
1
请问Qwen-7B的权重文件是只需要LFS的吗？还是全部文件都要呢？
#16 opened 5 months ago by cszhengyh
2
请教下为什么选用 qwen LLM 有和其他 baichuan2，chatglm3 做过比较么
#8 opened 6 months ago by valencebond
3
和千问VL做过比较吗？
#6 opened 6 months ago by FoolishMao
1
deepspeed training, meet the error "ValueError: optimizer got an empty parameter list"
#13 opened 7 months ago by sunnnnnnnny
4
Error：safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge
#10 opened 8 months ago by ccccai239
1
huggingface 下载的Qwen7B-chat/None
#9 opened 9 months ago by molyswu
1
Encountering RuntimeError Related to Process Group Initialization on RTX 3090
#1 opened 9 months ago by larrywo
1
学习率一直是1e-4不会下降？
#4 opened a year ago by Minami-su
3
ValueError: unknown url type: '/export/dataset/minigpt4/minigpt4_minigpt4qwen_format.json'
#3 opened a year ago by Minami-su
4