请问这是Deep Reinforcement Learning for List-wise Recommendations 这篇论文的代码吗
Daming0508 opened this issue · 15 comments
是的
好的谢谢 ! 感谢回复!
想请问一下是不是DDPG部分并没有复现Deep Reinforcement Learning for List-wise Recommendations这篇论文Online User-Agent Interaction Environment Simulator部分?
想请问一下是不是DDPG部分并没有复现Deep Reinforcement Learning for List-wise Recommendations这篇论文Online User-Agent Interaction Environment Simulator部分?
我大概明白了,作者在博客里写了是用了离线强化学习,这样的话也不用再写一个环境与Actor来进行交互,而是直接用已有的轨迹(历史数据)与actor进行交互。这样说应该没问题吧
是这样。
是这样。
好的,非常感谢您愿意回复我!
我最近也在跑这个代码,想应用到推荐场景,能不能聊一下,微信 mtax,拉个微信群也行 @massquantity @WinnieZM @Daming0508
是的
你好 想问一下在哪里体现出来了列表推荐呢?
@Daming0508 你好,我最近也在跑这个代码,但是运行出来的结果很奇怪,actor和critic的损失都很大,请问你也是这样吗?
@Daming0508 你好,我最近也在跑这个代码,但是运行出来的结果很奇怪,actor和critic的损失都很大,请问你也是这样吗?
我也遇到了这个问题,应该是参数设置的不对,正在调整中
@Daming0508 我尝试调整参数了,但是收效甚微,如果你修改成功可以分享一下吗,非常感谢!
@Daming0508 很抱歉再次打扰你,但是最近一直没什么思路,请问你解决了吗,这个损失过大的问题,sad....