HaloTrouvaille/YOLO-Multi-Backbones-Attention

量化问题

lxn96 opened this issue 4 years ago · 4 comments

lxn96 commented 4 years ago

你好，量化前后为什么保存的模型大小都是180MB，量化并没有减小模型的大小？

HaloTrouvaille commented 4 years ago

您好，我采用的是模拟量化，即模拟出量化效果，所以模型大小并没有减少。

lxn96 commented 4 years ago

那实际量化应该怎么做呢

HaloTrouvaille commented 4 years ago

您可以利用模拟量化部署时跑一次前向传播，提取出量化后的参数用于部署

TDIT-haha commented 4 years ago

那就是说保存量化后的参数模型，而不是整个模型是么？