RMS_DDPG: A Jupyter Notebook repository from JT623

环境

tensorflow >=2.0.0 tensorlayer >=2.0.0 numpy == 1.24.2

step1:根据每种微服务设定的不同的到达率lambd和服务器处理能力mu，初始化得到镜像数目 step2:每一步部署一个镜像，部署成功获得正向奖励reward,部署失败获得惩罚 step3:所有镜像部署完毕，计算时延，计算累加reward赋予最后一步

调整随机seed = 0,1,1037（lr = 0.005） 1.改变边缘节点数 nodes = 4,6,8,10 2.微服务种类数 num = 4,6,8,10

1.请求数 2.边缘节点 3.微服务种类数

1.cpu 2.mem 3.load 调整权重值作量化实验

1.lr 2.soft update factor mu 3.exploration factor var * 4.lstm * 5.hidden layers *

mb_ddpg rsdql ffd GMDA

mb_ddpg.py and rsdql.py 均是根据论文核心**复现运用在本模型上，为了适配本文建立的模型，有些许不同为了验证有效性，保持超参数基本一致