买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供了基于生成对抗网络的恶意域名训练数据生成方法,涉及网络信息安全技术领域,包括:1获取真实Alexa域名,构建域名数据集;2构建域名自编码器网络并训练;3利用训练好的域名自编码器网络构建域名生成对抗网络模型;4真实数据与自身产生数据判断,进行判别输出;5采用MMD检验输出样本与真实域名判别是否来自相同分布;6输出训练数据。本发明采用基于最大均值差异MMD的两样本检验方法来验证生成器的输出样本与真实的Alexa域名样本来自相同的分布,保证生成模型和生成数据的有效性。
主权项:1.基于生成对抗网络的恶意域名训练数据生成方法,其特征在于,包括如下步骤:获取真实域名,构建域名数据集;构建域名自编码器网络,将域名数据集输入域名自编码器网络进行预训练,得到训练后的域名自编码器网络;利用训练好的域名自编码器网络构建域名生成对抗网络模型,通过对真实数据与域名生成对抗网络模型产生的恶意域名数据进行判断,并输出判断结果;对域名生成对抗网络模型进行训练,并利用最大均值差异MMD检验判别域名生成对抗网络模型的输出样本是否与真实域名来自相同的分布,检验通过则停止训练,输出训练完成后的恶意域名训练数据;所述构建域名自编码器网络包括:通过3个平行的卷积网络和1个LSTM网络级联组成域名自编码器网络;通过3个卷积网络的卷积滤波核尺寸对应捕获域名数据字符间的n-gram信息;通过LSTM网络挖掘和表示变长域名序列的潜在特征,生成可变长序列;所述最大均值差异MMD具体定义为: 其中,p和q分别两个分布,x和y分别为p和q对应生成的样本,Ex,Ey分别为x和y两个生成样本f上函数值均值,对两个均值做差得到这两个分布对应于函数f的均值差MeanDiscrepancy,最大均值差异的目标是寻找一个f使得均值差最大,即得到最大均值差异;F取为希尔伯特空间的单位球,分别为实际操作时借助预先设定的核函数。
全文数据:
权利要求:
百度查询: 国家计算机网络与信息安全管理中心甘肃分中心 基于生成对抗网络的恶意域名训练数据生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。