论文阅读笔记样例

REFORMER:THE EFFICIENT TRANSFORMER arxiv

**论文小结:**作者提出了一种新的转换器模型,对体系架构进行了两项重大改进:

  • 1)使用可逆层以防止需要存储所有层的激活来进行反向传播;
  • 2)使用局部敏感哈希来估算耗时间的softmax计算。该Reformer的性能与SOTA Transformer模型相当,但内存效率更高,长序列的速度更快。

代码实现: github