请教一下 run_pt.sh 和 run_sft.sh 可以训练除了llma2以外的模型的吗比如我下面贴的

Question

Mr1994 opened this issue 10 months ago · 1 comments

模型训练与精调

None

Linux


https://huggingface.co/deepseek-ai/deepseek-coder-6.7b-instruct/tree/main
我们现在想训练另外一个模型 那么 run_pt和run_sft.sh 可以训练这个模型吗

# 请在此处粘贴依赖情况（请粘贴在本代码块里）

# 请在此处粘贴运行日志（请粘贴在本代码块里）

Answer 1 · 2023-12-19T06:55:07.000Z

原则上llama-2结构（不涉及GQA）的都可以训练。至于你说的模型是否是llama-2结构，请自行了解。
另外，你直接用对应模型提供的精调脚本不是更好吗？