YanjingLi0202/Q-ViT

请问这里的量化是说每个输入通道一个scale吗？

iamhankai opened this issue 2 years ago · 3 comments

iamhankai commented 2 years ago

Q-ViT/_quan_base.py

Line 191 in cc10d67

self.alpha = Parameter(torch.Tensor(in_features))

YanjingLi0202 commented 2 years ago

是的，我们是input channel-wise的方法。

iamhankai commented 2 years ago

那linear层怎么用int矩阵乘法做加速呢，是不是还要还原成fp32去做矩阵乘法？

YanjingLi0202 commented 2 years ago

linear层的加速应该跟conv层类似需要dequantize成fp32，具体实际部署需要使用部署框架。