PRDH算法的decorrelation_loss为什么不求平均
Opened this issue · 2 comments
sunyuxi commented
WangGodder commented
当时具体的思路也忘记了,不过我是做了平均的对照,发现不加平均的效果较好,并且根据loss来看,如果加了平均导致loss过低也不会发挥出什么作用。当然具体的思路我现在也记不清了,只有论文的作者知道吧
sunyuxi commented
当时具体的思路也忘记了,不过我是做了平均的对照,发现不加平均的效果较好,并且根据loss来看,如果加了平均导致loss过低也不会发挥出什么作用。当然具体的思路我现在也记不清了,只有论文的作者知道吧
明白了。感谢回复