ymcui/Chinese-LLaMA-Alpaca-2

中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models)

PythonApache-2.0

Issues

binascii.Error: Incorrect padding：How to solve it?
#569 opened 18 days ago by Bleado
2
训练数据和测试数据开源了么?
#566 opened a month ago by chg0901
6
单机多卡训练，加载数据集时卡住，大概是卡在training_args.main_process_first(desc="dataset map tokenization and grouping")，请问如何解决，谢谢
#570 opened a month ago by Wuhaotiantiantian
0
请问reward模型怎么部署推理？
#567 opened 2 months ago by slliao445
3
模型预训练时的labels问题
#565 opened 2 months ago by ybch14
2
模型微调
#564 opened 2 months ago by dongziyu1016
2
什么导致chinese-alpaca-2-7b推理存在大量重复生成情况呢
#568 opened 2 months ago by fxb392
6
使用transformer命令行进行交互时推理报错
#561 opened 2 months ago by Cbphcr
2
权重合并后重新加载训练时出现错误
#556 opened 2 months ago by Shajiu
30
微调后的lora模块
#558 opened 3 months ago by ymourenya
9
预训练数据以及微调数据会开源吗？
#559 opened 3 months ago by Chen-Song
2
模型，做了屏蔽词管理么？
#560 opened 3 months ago by RyanOvO
1
The model's performance is poor when using the merged tokenizer.
#540 opened 3 months ago by adam-mhd94
5
训练垂直领域大模型应该基于哪个版本？
#555 opened 3 months ago by Zheng-Jay
3
多卡训练卡在加载模型
#552 opened 3 months ago by ymourenya
7
HELP!!!!!!!!!!!!!!!!!!!!!!!
#562 opened 3 months ago by xiaoToby
1
ImportError: /usr/local/lib/python3.10/dist-packages/transformer_engine_extensions.cpython-310-x86_64-linux-gnu.so: undefined symbol:
#553 opened 3 months ago by alf-wangzhi
2
通过openai_server_demo/openai_api_server_vllm.py 运行，输出出现自问自答
#554 opened 3 months ago by Chaoran-F
2
无法从checkpoint恢复训练
#551 opened 3 months ago by LuckyGlass
3
指令精调
#550 opened 3 months ago by dongziyu1016
4
预训练完成后模型的使用
#548 opened 3 months ago by ymourenya
4
指令精调
#549 opened 3 months ago by dongziyu1016
2
6卡指令精调，报错oom
#547 opened 3 months ago by afezeriaWrnbbmm
4
finetune之后的模型使用
#546 opened 3 months ago by xiaoToby
3
在精调的时候，如何让模型在指定的GPU上运行，而不是只在cuda:0上
#544 opened 3 months ago by ZhenHengDong
4
'padding_value' (position 3) must be float, not NoneType
#545 opened 3 months ago by liqinga
3
词汇表扩充并且增量训练的具体流程和修改哪些部分？
#543 opened 3 months ago by Shajiu
7
访问次数多了以后显存不释放
#532 opened 3 months ago by godotg
6
请教一个问题。如何才能喂饱多个GPU
#531 opened 3 months ago by leonunix
3
如何调整 Batch Size
#530 opened 3 months ago by 1099255210
3
卡在加载数据集这一步
#537 opened 3 months ago by dehaozhou
5
How can I output generation scores(logits)?
#541 opened 3 months ago by Sishxo
2
1.3B模型是如何训练的？
#529 opened 4 months ago by makotov
6
运行时显存占用过大和没有获取json返回体
#525 opened 4 months ago by xiaoToby
17
请问本仓库能否基于YaRN进行sft？
#524 opened 4 months ago by Zheng-Jay
5
词汇表扩充后出现错误？
#542 opened 4 months ago by Shajiu
1
ceval的zero-shot测评，原生的llama-2-7b比本仓库的中文llama-2-7b效果要好
#533 opened 4 months ago by xiaoxunlong
1
扩充词表后对新添加token初始化的方式
#538 opened 4 months ago by YoLo-MUC
2
model will broken when i start pretraining
#521 opened 4 months ago by Abolfazl-kr
3
运行模型时output norm.weight' notfound如何解决
#534 opened 4 months ago by dyqc
2
load_in_8bit 推理耗时比fp16长
#516 opened 5 months ago by haoxurt
3
Knowledge updation
#527 opened 5 months ago by ForestR
1
奖励模型如何进行推理
#503 opened 5 months ago by wuhuanon
3
指令精调模型后生成的文件中只有adapter_model.safetensors，没有adapter_model.bin
#504 opened 5 months ago by slamdunk77
4
关于强化学习
#506 opened 5 months ago by wuhuanon
3
请教如何更换Tokenizer进行训练，Tokenizer大小不匹配问题
#514 opened 5 months ago by wangzhengh
6
“基座模型”和“指令模型”该怎么使用？
#522 opened 5 months ago by kgdxpr
1
llama.cpp部署出现格式错误
#519 opened 6 months ago by HelloEveryonehh
3
使用flash attention会报错
#502 opened 6 months ago by Go4miii
2
报错import name 'insecure_hashlib' from 'huggingface_hub.utils'
#508 opened 6 months ago by Go4miii
0