恭喜北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司杨永清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司申请的专利基于子词分割的DGA检测模型训练方法、检测方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114065754B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111300700.9,技术领域涉及:G06F40/284;该发明授权基于子词分割的DGA检测模型训练方法、检测方法及装置是由杨永清设计研发完成,并于2021-11-04向国家知识产权局提交的专利申请。
本基于子词分割的DGA检测模型训练方法、检测方法及装置在说明书摘要公布了:本发明公开了一种基于子词分割的DGA检测模型训练方法、检测方法及装置,包括获取样本流量数据,并提取各条样本流量数据对应的主域名和顶级域名,以形成第一域名文件;对第一域名文件中的各域名进行分割,以获得包含各域名输入序列片段的片段文件;基于片段文件中整词和或子词的出现频率构建向量映射字典;利用向量映射词典对各域名的输入序列片段进行编码,以获得相应的编码向量;为各编码向量添加训练标签,以作为训练数据对DGA检测模型进行训练。本公开的方法构建的编码向量考虑了域名的组成结构以及词间顺序,通过生成的句子编码向量对域名进行分类,能够准确地检测出低随机性的DGA家族和基于字典的DGA家族。
本发明授权基于子词分割的DGA检测模型训练方法、检测方法及装置在权利要求书中公布了:1.一种基于子词分割的DGA检测模型训练方法,其特征在于,包括:获取样本流量数据,并提取各条样本流量数据对应的主域名和顶级域名,以形成第一域名文件;基于预先构建的分词词典对所述第一域名文件中的各域名进行分割,以获得包含各域名输入序列片段的片段文件,其中各域名的输入序列片段包括整词和或子词以及相应的词粒度的N-Gram;基于所述片段文件中整词和或子词以及词粒度的N-Gram的出现频率构建向量映射字典;利用所述向量映射词典对各域名的输入序列片段进行编码,以获得相应的编码向量;为各编码向量添加训练标签,以作为训练数据对DGA检测模型进行训练;利用所述向量映射词典对各域名的输入序列片段进行编码,以获得相应的编码向量包括:基于所述向量映射字典的索引以及各域名的输入序列片段将各域名编码为指定长度的编码向量,其中若所述向量映射字典的词出现在该域名中,则该词在该向量映射字典中的索引为预置值,且对应的编码向量与所述预置值对应的位置具有相应的指示值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司,其通讯地址为:100085 北京市海淀区上地东路1号院3号楼四层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。