ZhugeKongan/Attention-mechanism-implementation

请问这些注意力模块都是加在最后一层训练的吗,还是某一层

qubewx opened this issue · 0 comments

请问这些注意力模块都是加在最后一层训练的吗,还是某一层