一种基于EMO-GAN的恶意URL检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山西大学

摘要：本发明属于网络安全的技术领域，具体涉及为一种基于EMO‑GAN的恶意URL检测方法。本发明通过创新性通过引入极度随机树（ExtremelyRandomizedTrees，ET）实现半监督学习，与边缘生成对抗网络（MarginGenerativeAdversarialNetwork，MarginGAN）相结合，有效克服了数据不均衡和标签稀缺带来的数据获取困难。此外，本发明还深入探索了新的特征提取方法以及在线学习技术，为恶意URL检测提供了更加精确的特征表示和更强的模型拓展性。该方法旨在解决恶意URL检测中遇到的数据获取难题、特征表示不足以及模型概念漂移等挑战。经过实验验证，本发明在真实世界数据集上取得了较好的结果。因此，本发明可用于对恶意URL进行检测，维护网络空间安全。

主权项：1.一种基于EMO-GAN的恶意URL检测方法，其特征在于：包括以下几个步骤：步骤1、数据预处理：使用爬虫工具从网页中获取URL数据，进行清洗、解码、标准化处理，得到样本数据；步骤2、特征工程：使用Python工具构建特征提取模块，特征提取模块包括统计特征提取子模块、字符特征提取子模块、词汇特征提取子模块以及融合特征子模块，将步骤1中得到的样本数据分别输入到统计特征提取子模块、字符特征提取子模块、词汇特征提取子模块中，得到128维的统计特征、64维的字符特征和64维的词汇特征，将三种特征输入至融合特征子模块中合并输出256维特征，其中256维特征包括带标签的样本特征和无标签的样本特征；步骤3、检测模型的构建与训练：步骤3.1，模型的构建，检测模型包括极度随机树分类器模块、生成器模块、辨别器模块和分类器模块，其中采用Scikit-learn库进行搭建极度随机树分类器模块，采用PyTorch框架进行构建生成器模块、辨别器模块和分类器模块；步骤3.2，模型的训练，提前设定好模型的训练轮次，将步骤2得到的256维特征输入至检测模型中进行训练，利用带标签的特征对极度随机树分类器模块进行训练，将随机分布输入至生成器模块中输出256维的生成样本特征，将生成样本特征和无标签的样本特征输入至训练好的极度随机树分类器模块中打上标签，将所有带标签的特征分别输入至辨别器模块和分类器模块中进行训练，生成器模块分别通过与辨别器模块和分类器模块进行对抗训练；步骤4、模型的性能评价：采用精准率、召回率、F1分数的宏平均值作为模型的评价指标，若准确率大于99%并且F1分数大于80%，执行步骤5，否则，执行步骤3.2继续模型训练；步骤5、恶意URL的检测：从真实网页中采集URL数据作为待测数据，将待测数据采用步骤1、步骤2处理得到输出256维特征，然后输入到已训练好的分类器模块中进行分类预测，得到相应的标签，完成检测；步骤6、检测模型的在线更新：将步骤5得到的预测标签进行人工反馈验证，得到待测数据的真实标签，将步骤5得到待测数据的256维特征和人工反馈的真实标签输入到分类器模块中进行在线学习与更新。

全文数据：

权利要求：

百度查询：山西大学一种基于EMO-GAN的恶意URL检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种气象对人和装备的影响效应评估方法

下一篇：一种正极补锂剂、正极浆料及其制备方法与应用

相关技术

一种气象对人和装备的影响效应评估方法

一种正极补锂剂、正极浆料及其制备方法与应用

一种污染空气净化方法

一种用于处理生物质气化合成气的非催化转化POX转化炉及处理方法

基于混合现实技术的PICC置管长度测量和尖端定位的方法

电子设备、页面展示方法、交通工具及计算机程序产品

无人机定位方法、装置及系统

通过中间散热器将物体附接到基座

一种虫情测报模型的训练方法、装置、介质和计算设备

一种应急干预计划的生成方法和系统

一种基于边缘计算的污染排放多源监测分析系统及方法

一种基于协同强化学习的多无人机轨迹规划和数据收集方法

恶意相关技术

改进的恶意软件检测方法和系统_摩根大通国家银行_201980035333.9

网络恶意流量检测方法、装置、终端及介质_国网浙江省电力有限公司杭州供电公司_202411147797.8

基于相互对抗网络的恶意流量半监督检测方法_重庆科技大学_202410630846.7

一种逃避型恶意软件检测方法及系统_中国科学院信息工程研究所_202410462681.7

恶意网址处理方法、装置、计算机设备及存储介质_北京恒安嘉新安全技术有限公司_202111131450.0

多维特征协同的恶意样本分析方法、装置及系统_杭州海康威视数字技术股份有限公司_202411320858.6

一种恶意代码检测方法及相关装置_华为技术有限公司_202310480796.4

基于注意力机制和深度学习的恶意流量检测方法及系统_山东大学_202410786301.5

一种通过内存管理单元突破恶意软件防护的方法、装置_中金金融认证中心有限公司_202311640794.3

一种基于EMO-GAN的恶意URL检测方法_山西大学_202410960330.9

检测相关技术

检测装置及检测系统_深圳市联普医疗科技有限公司_202420211478.8

检测装置及检测系统_浙江莱恩海思医疗科技有限公司_202420221242.2

阀门检测装置及阀门检测方法_特嗨氢能检测(保定)有限公司_202310484635.2

水壶漏水检测装置及其检测方法_广东众星电器有限公司_201810643198.3

车辆故障检测方法和检测装置_成都赛力斯科技有限公司_202411338113.2

安全检测系统及安全检测方法_上海湃道智能科技有限公司_202311440319.1

检测系统_特瑞视觉有限公司_201680073842.7

检测装置_株式会社日本显示器_202380019521.9

检测装置_株式会社日本显示器_202410872385.4

检测设备_东莞市兆丰精密仪器有限公司_202410890370.0

方法相关技术

涂装方法_本田技研工业株式会社_202310467404.0

灭菌方法_三浦工业株式会社_202110207403.3

切断方法_日本制铁株式会社_202080020242.0

版图图案的分割方法、光学邻近修正方法和半导体器件制造方法_三星电子株式会社_201910492972.X

贴合方法_松下知识产权经营株式会社_202410508253.3

控制方法_浙江盾安机电科技有限公司_202310484315.7

处理方法_联想(北京)有限公司_202410869738.5

时差隐私保护方法及基于该方法的医学急救车辆调度方法_徐州医科大学_202410828080.3

代码处理方法、训练数据的处理方法及模型微调方法_支付宝(杭州)信息技术有限公司_202411075167.4

布局校正方法以及使用该布局校正方法的掩模制造方法_三星电子株式会社_202410515142.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于EMO-GAN的恶意URL检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务