rl-ddos

针对现有DDoS检测方法误报率高的问题, 提出了一种部分丢弃DDoS流量的方法, 通过时序预测预测未来流量大小, 并使用强化学习方法学习最佳的DDoS流量丢弃方案, 用于缓解误报率带来的问题, 并实现了算法的仿真.

基于强化学习实现最佳丢弃率的选择, 基于框架OpenAI Gym和Baselines, 使用PPO(近端策略优化)算法, 以丢弃率作为动作空间, 流量大小作为观察空间, 通过的正常流量总数作为奖励, 模型根据动作和观察空间的反馈进行学习, 最终学习到丢弃流量的最佳策略

yuvihh/rl-ddos