请问这是Deep Reinforcement Learning for List-wise Recommendations 这篇论文的代码吗

Question

Daming0508 opened this issue 2 years ago · 15 comments

是的

Answer 1 · 2022-09-24T02:21:28.000Z

好的谢谢！感谢回复！

Answer 2 · 2022-11-08T03:12:14.000Z

想请问一下是不是DDPG部分并没有复现Deep Reinforcement Learning for List-wise Recommendations这篇论文Online User-Agent Interaction Environment Simulator部分？

Answer 3 · 2022-11-08T08:45:55.000Z

想请问一下是不是DDPG部分并没有复现Deep Reinforcement Learning for List-wise Recommendations这篇论文Online User-Agent Interaction Environment Simulator部分？

我大概明白了，作者在博客里写了是用了离线强化学习，这样的话也不用再写一个环境与Actor来进行交互，而是直接用已有的轨迹（历史数据）与actor进行交互。这样说应该没问题吧

Answer 4 · 2022-11-08T14:50:06.000Z

是这样。

Answer 5 · 2022-11-09T02:19:14.000Z

是这样。

好的，非常感谢您愿意回复我！

Answer 6 · 2022-11-16T10:28:24.000Z

我最近也在跑这个代码，想应用到推荐场景，能不能聊一下，微信 mtax，拉个微信群也行 @massquantity @WinnieZM @Daming0508

Answer 7 · 2023-03-09T01:16:11.000Z

是的

你好想问一下在哪里体现出来了列表推荐呢？

Answer 8 · 2023-03-09T14:26:24.000Z

Answer 9 · 2023-03-10T12:12:08.000Z

推荐方法参照 https://github.com/massquantity/Flink-Reinforcement-Learning/blob/master/python_api/ddpg.py#L37

感谢回复！

Answer 10 · 2023-04-01T10:40:13.000Z

@Daming0508 你好，我最近也在跑这个代码，但是运行出来的结果很奇怪，actor和critic的损失都很大，请问你也是这样吗？

Answer 11 · 2023-04-18T00:04:08.000Z

@Daming0508 你好，我最近也在跑这个代码，但是运行出来的结果很奇怪，actor和critic的损失都很大，请问你也是这样吗？

我也遇到了这个问题，应该是参数设置的不对，正在调整中

Answer 12 · 2023-04-19T11:52:52.000Z

@Daming0508 我尝试调整参数了，但是收效甚微，如果你修改成功可以分享一下吗，非常感谢！

Answer 13 · 2023-04-25T12:28:39.000Z

@Daming0508 很抱歉再次打扰你，但是最近一直没什么思路，请问你解决了吗，这个损失过大的问题，sad....