HaloTrouvaille/YOLO-Multi-Backbones-Attention

量化问题

lxn96 opened this issue · 4 comments

lxn96 commented

你好,量化前后为什么保存的模型大小都是180MB,量化并没有减小模型的大小?

您好,我采用的是模拟量化,即模拟出量化效果,所以模型大小并没有减少。

lxn96 commented

那实际量化应该怎么做呢

您可以利用模拟量化 部署时跑一次前向传播,提取出量化后的参数用于部署

那就是说保存量化后的参数模型,而不是整个模型是么?