买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国海洋石油集团有限公司
摘要:本发明提供一种基于海量安全数据的安全分析方法和系统,通过定义恶意关键词的特征,并由此制定规则,完成恶意关键词自动抽取,以及提取涉及链接的非字母及非数字的符号,根据其出现的概率排序,计算相邻符号的概率值之差,将上述差的最大值作为分界,完成恶意符号自动抽取,得到恶意数据集,构建安全数据映射关系,得到权重向量,归一化后得到定长的特征向量,构造训练模型,实现对安全数据的分析检测,上述过程没有采用传统的特征提取方式,从而可以克服现有技术存在无法对新型网络攻击自动识别进行网络防御的问题。
主权项:1.一种基于海量安全数据的安全分析方法,其特征在于,所述方法包括:数据预处理:对采集到的安全数据进行清洗、标准化和格式化处理,得到处理后的第一数据,以便后续的分析和处理;根据词汇模式和语法结构定义恶意关键词的特征,由所述恶意关键词的特征制定第一规则,基于该第一规则完成第一数据的恶意关键词自动抽取,将抽取到的恶意关键词放入候选集中;对所述候选集中的每个恶意关键词,计算其出现的概率pf=fnfa,其中fn是在正常数据中出现的频次,fa是在异常数据中出现的频次,选取pf值升序排序在前若干个的恶意关键词构建恶意关键词数据集;恶意符号自动抽取:提取所述第一数据中涉及链接的非字母及非数字的符号,计算所有符号出现的概率,将其升序排列,并计算相邻符号的概率值之差,将上述差的最大值作为分界,选取分界之下的前若干个的符号构建恶意符号集;构建恶意数据集,其由恶意关键词数据集和恶意符号集两部分构成;构建安全数据映射关系,将所述恶意数据集中关键词或符号转换为对应的字符串序列,将字符串序列中任意连续两个相邻字符映射为0-9之间的权重数字,从而将整个恶意数据集都转换为长度不等的权重向量;设置长度为k的滑动窗口,从权重向量的第一个权重数字开始移动,每次移动的步长为一个权重数字,从而实现将长度不等的权重向量转换为长度为k的定长特征向量;基于特征向量训练支持向量机分类器,以支持向量机中的数据类别间隔和数据相似度极大化为目标函数构造模型;实时分析:利用训练好的模型对实时采集到的安全数据进行实时分析,发现异常和潜在的安全威胁;离线分析:对历史数据进行深度分析和挖掘,发现潜在的安全漏洞和攻击模式。
全文数据:
权利要求:
百度查询: 中国海洋石油集团有限公司 一种基于海量安全数据的安全分析方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。