massquantity/DBRL

请问这是Deep Reinforcement Learning for List-wise Recommendations 这篇论文的代码吗

Daming0508 opened this issue · 15 comments

请问这是Deep Reinforcement Learning for List-wise Recommendations 这篇论文的代码吗

是的

好的谢谢 ! 感谢回复!

想请问一下是不是DDPG部分并没有复现Deep Reinforcement Learning for List-wise Recommendations这篇论文Online User-Agent Interaction Environment Simulator部分?

想请问一下是不是DDPG部分并没有复现Deep Reinforcement Learning for List-wise Recommendations这篇论文Online User-Agent Interaction Environment Simulator部分?

我大概明白了,作者在博客里写了是用了离线强化学习,这样的话也不用再写一个环境与Actor来进行交互,而是直接用已有的轨迹(历史数据)与actor进行交互。这样说应该没问题吧

是这样。

是这样。

好的,非常感谢您愿意回复我!

我最近也在跑这个代码,想应用到推荐场景,能不能聊一下,微信 mtax,拉个微信群也行 @massquantity @WinnieZM @Daming0508

是的

你好 想问一下在哪里体现出来了列表推荐呢?

@Daming0508 你好,我最近也在跑这个代码,但是运行出来的结果很奇怪,actor和critic的损失都很大,请问你也是这样吗?
image

@Daming0508 你好,我最近也在跑这个代码,但是运行出来的结果很奇怪,actor和critic的损失都很大,请问你也是这样吗? image

我也遇到了这个问题,应该是参数设置的不对,正在调整中

@Daming0508 我尝试调整参数了,但是收效甚微,如果你修改成功可以分享一下吗,非常感谢!

@Daming0508 很抱歉再次打扰你,但是最近一直没什么思路,请问你解决了吗,这个损失过大的问题,sad....