ymcui/Chinese-LLaMA-Alpaca-2
中文LLaMA-2 & Alpaca-2大模型二期项目 + 64K超长上下文模型 (Chinese LLaMA-2 & Alpaca-2 LLMs with 64K long context models)
PythonApache-2.0
Issues
- 0
- 2
- 6
什么导致chinese-alpaca-2-7b推理存在大量重复生成情况 呢
#568 opened - 3
请问reward模型怎么部署推理?
#567 opened - 6
训练数据和测试数据开源了么?
#566 opened - 2
模型预训练时的labels问题
#565 opened - 2
模型微调
#564 opened - 1
HELP!!!!!!!!!!!!!!!!!!!!!!!
#562 opened - 2
使用transformer命令行进行交互时推理报错
#561 opened - 1
模型,做了屏蔽词管理么?
#560 opened - 2
预训练数据以及微调数据会开源吗?
#559 opened - 9
微调后的lora模块
#558 opened - 30
权重合并后重新加载训练时出现错误
#556 opened - 3
训练垂直领域大模型应该基于哪个版本?
#555 opened - 2
- 2
- 7
多卡训练卡在加载模型
#552 opened - 3
无法从checkpoint恢复训练
#551 opened - 4
指令精调
#550 opened - 2
指令精调
#549 opened - 4
预训练完成后模型的使用
#548 opened - 4
6卡指令精调,报错oom
#547 opened - 3
finetune之后的模型使用
#546 opened - 3
- 4
在精调的时候,如何让模型在指定的GPU上运行,而不是只在cuda:0上
#544 opened - 7
词汇表扩充并且增量训练的具体流程和修改哪些部分?
#543 opened - 1
词汇表扩充后出现错误?
#542 opened - 2
How can I output generation scores(logits)?
#541 opened - 5
- 2
扩充词表后对新添加token初始化的方式
#538 opened - 5
卡在加载数据集这一步
#537 opened - 2
运行模型时output norm.weight' notfound如何解决
#534 opened - 1
- 6
访问次数多了以后显存不释放
#532 opened - 3
请教一个问题。如何才能喂饱多个GPU
#531 opened - 3
如何调整 Batch Size
#530 opened - 6
1.3B模型是如何训练的?
#529 opened - 1
Knowledge updation
#527 opened - 17
运行时显存占用过大和没有获取json返回体
#525 opened - 5
请问本仓库能否基于YaRN进行sft?
#524 opened - 1
“基座模型”和“指令模型”该怎么使用?
#522 opened - 3
model will broken when i start pretraining
#521 opened - 3
llama.cpp部署出现格式错误
#519 opened - 3
load_in_8bit 推理耗时比fp16长
#516 opened - 6
请教如何更换Tokenizer进行训练,Tokenizer大小不匹配问题
#514 opened - 0
- 3
关于强化学习
#506 opened - 4
- 3
奖励模型如何进行推理
#503 opened - 2
使用flash attention会报错
#502 opened