THUDM/ComiRec

关于capsule_weight的疑问

dawuchen opened this issue · 1 comments

有2个地方想请问下:

  1. 这里capsule_weight是用的普通的tensor而不是variable,请问是对于每个batch的每个样本,一次前向计算时都会做随机初始化然后做3次迭代吗?那inference的时候也是需要做迭代过程?
  2. 我这边的几个训练任务,得到的capsule_weight以及之后的dnn的各层输出的norm值都非常大,请问这是正常的吗?
    image

Hi @dawuchen, 抱歉没能及时回复。

  1. 是的。inference的时候也需要迭代过程。
  2. 这个我没有输出看过,可能跟capsule里用的squashing function有关。