tsinghua-fib-lab/DICE

关于数据集处理的细节询问

Closed this issue · 2 comments

作者您好!感谢您贡献的高质量论文和代码。
关于数据集处理,我理解是这样做的:首先按照物品流行度的倒数采样出40%作为intervened数据(intervened数据随机地分为四份),另外60%作为normal数据;normal数据和一份intervened数据合在一起作为training set;一份intervened数据作为validation set;两份intervened数据作为test set。
请问您是这样做的吗?如果我理解有偏差,希望您指正,谢谢!
image
image

嗯嗯 是的,您理解的没有问题

好的,谢谢!