Opened this issue 8 months ago · 1 comments
例如从头训练一个1B的llama2架构的模型.
你好,我们会增加这样的例子但现在还不能保证时间。
目前应该可以用from_config加载模型,config里init_method可以指定参数初始化方法。然后开始训练。