基于AST的webshell AI检测 简介 通过将php文件解析成AST(抽象语法树),再将树的节点提取出来用于构成词袋模型进行特征输入,然后利用 MPL或KNN 算法进行训练,将训练的模型用pickle序列化保存用于后续检测 目录结构 src 存放实验相关的代码,具体请看其中的README webshell 收集的webshell数据 whitecode 收集的正常代码数据 ps: 因为大小限制,未将数据集进行上传,需要复现请自行根据src中的README clone到对应的文件夹