xiangyue9607/SanText

对比文献Feyisetan的代码

Opened this issue · 4 comments

你好,麻烦能上传下对比文献部分的代码吗?

复现时始终和文献中对比试验结果有差距,想用你的来跑一下看下结果。

有差距的原因可能是因为原论文的噪声用gamma distribution作为标量,这个分布的Theta是1/ε,scale是单词的维度,而glove词嵌入维度是300,"300"这个数值太大了,你看下面这个图就知道了:
图片
随机采样的50个标量都远远大于词嵌入向量之间的距离,我也不知道怎么解决,如果你有好的办法能说一声吗?

顺便记录一下采样多元正态分布的球面向量
图片

复现时始终和文献中对比试验结果有差距,想用你的来跑一下看下结果。

请问下找到解决办法了吗,我也有这个问题?