/Reproduct-latest-DGA-tasks

这个任务是作者在鹏程实验室智能网络组实习时所做的部分工作(2022.10-2023.06),为了进行对比实验,所以就对最新的这方面DGA任务进行了复现(CCF B类/CCF C类),主要是三个模型:LSTM模型,集成学习模型(CNN+LSTM),BiLSTM+attention模型。

Primary LanguagePythonGNU General Public License v3.0GPL-3.0

关于恶意域名检测任务(DGA)任务的复现

这个其实只能说是大工作中的很小的一部分,大工作

任务背景

这个任务是作者在鹏程实验室智能网络组实习时所做的部分工作(2022.10-2023.06),为了与我们的工作进行对比实验,所以就对最新的这方面DGA任务进行了复现(CCF B类/CCF C类),主要是三个模型:LSTM模型,集成学习模型(CNN+LSTM),BiLSTM+attention模型。

PaPer部分

Paper文件夹下是关于这方面复现读的一些论文,只选择了一些较优的进行复现

PPT部分

PPT文件下是实习期间差不多两周一次进行的组会报告的PPT

Code部分

这个部分公示了复现的源码,主要就是根据文章中说明的网络结构,设置的超参数来搭建神经网络,主要复现了其中的三篇。

Result部分

这个部分是实验的中间结果

后续在论文发表之后会在这个仓库更新主要工作模型的代码,我们做的这个工作主要是AutoML领域的神经网络架构搜索(NAS)方面。

其中我们的恶意数据是从360实验获取,良性的是从alexa排名获取,并进行了一些预处理,最终训练测试的数据量大概在50万左右。欢迎大家对其中的一些部分进行指正!