扩充词表后对新添加token初始化的方式

Question

YoLo-MUC opened this issue 6 months ago · 2 comments

其他问题

Chinese-LLaMA-2 (7B/13B)

Linux

老师您好，请问对原32000的词表扩充后，对新添加的token在模型的embedding层和lm_head层初始化的方式是什么呢？

我看他人有做均值扩充、随机扩充和带噪均值扩充，但是不知道有什么选择技巧，想请教下老师的看法和咱们LLaMA2-Chinese所选择的方式，谢谢老师！

# 请在此处粘贴依赖情况（请粘贴在本代码块里）

# 请在此处粘贴运行日志（请粘贴在本代码块里）

Answer 1 · 2024-03-08T03:37:54.000Z

均值初始化效果相对较好。

Answer 2 · 2024-03-08T03:41:34.000Z

均值初始化效果相对较好。

好的，谢谢老师