关于论文中稀疏训练的损失函数的疑惑
songyang86 opened this issue · 1 comments
songyang86 commented
大牛,我想问一个问题,我觉的论文《Learning Efficient Convolutional Networks Through Network Slimming》中给出的损失函数是针对需要剪枝的BN层的,而网络的最后层的损失函数还是经典的yolov3的损失函数,可以这样理解吗?根据代码的意思,最后的loss依然是经典的yolov3的损失函数值,没有加入L1正则的损失值
期待您的回复。十分感谢
HaolyShiit commented
在这里,作者直接根更新BN层的gamma参数,类似于权重的L1正则化:
YOLOv3-complete-pruning/train.py
Lines 323 to 327 in 90c5869
YOLOv3-complete-pruning/utils/prune_utils.py
Lines 121 to 129 in 90c5869
不过我也有一个疑惑,在更新BN层gamma参数的时候,作者加上了L1函数导数值,我觉得应该是减去?