mechanicalsea/source-tracking-slp

源位置隐私中，研究利用增强学习方法回溯源节点的攻击者，分析其学习性能

Jupyter Notebook

source-tracking-slp

源位置隐私中，研究利用增强学习方法回溯源节点的攻击者，分析其学习性能

增强学习模型

代理观测环境，执行动作，获得环境给予的回报，根据回报；如此反复，代理根据环境给予的回报调整动作，以实现累积回报最大化。

代理攻击者模型，观测网络中的通信流量。
环境网格化网络系统模型，网络中存在通信链路。
动作网格化网络中的移动，有 4 种运动方式，即上、下、左、右。
回报达到源节点，回报为 0，其他情况回报为 1。