ShanleiMu/CGKR

不可微的问题

LDY911 opened this issue · 0 comments

请教您一个问题,论文中的反事实生成器在每次选择属性时是根据得分高低显性的选择,得到新的属性后,推荐器基于新的属性计算奖励、进行推荐等等,那么根据得分选择的这个过程是否存在不可微的情况,梯度传播是否会断,我看到论文中并没有相关的比如使用gumbel重参化的措施,期待您的回复,谢谢!!