/source-tracking-slp

源位置隐私中,研究利用增强学习方法回溯源节点的攻击者,分析其学习性能

Primary LanguageJupyter Notebook

source-tracking-slp

源位置隐私中,研究利用增强学习方法回溯源节点的攻击者,分析其学习性能

增强学习模型

代理观测环境,执行动作,获得环境给予的回报,根据回报;如此反复,代理根据环境给予的回报调整动作,以实现累积回报最大化。

  • 代理 攻击者模型,观测网络中的通信流量。
  • 环境 网格化网络系统模型,网络中存在通信链路。
  • 动作 网格化网络中的移动,有 4 种运动方式,即上、下、左、右。
  • 回报 达到源节点,回报为 0,其他情况回报为 1。