gaohongkui/GlobalPointer_pytorch

是否可以训练出1024长度的模型

Opened this issue · 0 comments

您好,我看您采用了旋转式位置编码RoPE,是不是意味着可以训练出1024长度的模型呢?