Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于AI驱动的数据传输威胁检测方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏冬云云计算股份有限公司

摘要:本发明涉及数据传输威胁检测技术领域,具体为一种基于AI驱动的数据传输威胁检测方法和系统,包括规则匹配模块、近邻算法模型模块和结果分析模块。本发明中,规则匹配模块通过网络监控设备收集数据包信息,对收集的数据进行过滤无关信息、会话重构和结构化的转换,并与数据规则库中的签名和规则进行比对,匹配成功的数据标记为异常,并将结构化的数据和匹配结果进行输出,近邻算法模型模块从数据包信息中提取数据特征,利用近邻算法进行异常检测,将置信度和是否异常结果进行输出,结果分析模块比较规则匹配模块和近邻算法模型模块中的输出结果,根据比较结果确定最终结果和优化处理。

主权项:1.一种基于AI驱动的数据传输威胁检测系统,其特征在于:包括规则匹配模块(100)、近邻算法模型模块(200)和结果分析模块(300),其中:所述规则匹配模块(100)通过网络监控设备收集数据包信息,对收集的数据进行过滤无关信息、会话重构和结构化的转换,并与数据规则库中的签名和规则进行比对,匹配成功的数据标记为异常,并将结构化的数据和匹配结果进行输出;所述近邻算法模型模块(200)从数据包信息中提取数据特征,利用近邻算法进行异常检测,通过计算待分析样本与训练集中样本的欧几里得距离,找出K个最近邻居,并应用多数表决原则分别判断样本是否异常和预测置信度,其中K表示在进行分类和回归时考虑的最近邻居的数量,将置信度和是否异常结果进行输出;所述结果分析模块(300)比较规则匹配模块(100)和近邻算法模型模块(200)中的输出结果,比较一致时,确定预测结果为最终结果;比较不一致时,将规则匹配模块(100)中的结构化的数据和近邻算法模型模块(200)中的置信度与原始输入数据进行整合,所述结果分析模块(300)利用决策树算法进行结果是否异常的预测,并将该预测结果分别与规则匹配模块(100)和近邻算法模型模块(200)中的输出结果进行比较,根据比较结果分别对规则匹配模块(100)和近邻算法模型模块(200)进行优化处理,优化处理之后,按照之前的逻辑进行再次的结果预测和比较,直到确定最终结果;所述规则匹配模块(100)包括传输数据采集单元(101)和传输数据分析单元(102),所述传输数据采集单元(101)通过网络监控设备收集数据包信息;所述传输数据分析单元(102)对收集的数据进行过滤无关信息、会话重构和结构化的转换,并与数据规则库中的签名和规则进行比对,匹配成功的数据标记为异常,并将结构化的数据和匹配结果进行输出;所述近邻算法模型模块(200)包括传输数据处理单元(201)和近邻算法分析单元(202),所述传输数据处理单元(201)从数据包信息中提取数据特征;所述近邻算法分析单元(202)利用近邻算法进行异常检测,通过计算待分析样本与训练集中样本的欧几里得距离,找出K个最近邻居,并应用多数表决原则分别判断样本是否异常和预测置信度,其中K表示在进行分类和回归时考虑的最近邻居的数量,将置信度和是否异常结果进行输出;所述结果分析模块(300)包括结果比对单元(301)、结果确定单元(302)和反馈优化单元(303),所述结果比对单元(301)比较传输数据分析单元(102)和近邻算法分析单元(202)中的预测结果,比较一致时,则确定预测结果为最终结果;比较不一致时,将规则匹配模块(100)中的传输数据分析单元(102)中的结构化的数据和近邻算法分析单元(202)中的置信度与原始输入数据进行整合,并将整合数据发送给结果确定单元(302);所述结果确定单元(302)利用决策树算法进行数据状态的结果预测,将预测的结果与传输数据分析单元(102)的预测结果和近邻算法分析单元(202)中的预测结果分别进行比较,根据比较结果启动反馈优化单元(303)进行优化处理;所述结果确定单元(302)利用决策树算法进行数据状态的结果预测,具体包括:计算整个数据集的熵,熵表示数据不纯度的度量,决定了数据中存在多少随机性,对于数据集中的每一类都计算出现概率和这个概率的对数的乘积,将所有这些乘积相加并取负值;对于数据集中的每个特征,按照该特征的不同值将数据集划分为几个子集,并计算每个子集的熵,用每个子集的大小加权求和,得到按此特征划分数据集后的总体熵;信息增益等于数据集原始熵与按照特征划分后的条件熵之间的差异,差值表明了通过考虑这个特征后数据随机性减少的程度;比较所有特征的信息增益,选择信息增益最大的特征作为分割点;用选定的特征分割数据集,对每个子集重复上述过程,直到达到所有的实例都属于同一个类别;所述结果确定单元(302)根据比较结果启动反馈优化单元(303)进行优化处理,具体包括:结果确定单元(302)的预测结果与传输数据分析单元(102)的预测结果不一样时,反馈优化单元(303)对规则匹配模块(100)中的传输数据分析单元(102)中的数据进行优化处理,通过标准化数据、计算协方差矩阵、求解特征值和特征向量,选特征向量组成新的特征空间,并通过这些向量将原始数据变换到一个低维空间中,保持了最大程度的数据方差,简化数据集的复杂度并突出数据的主要结构进行优化处理;结果确定单元(302)的预测结果与近邻算法分析单元(202)的预测结果不一样时,反馈优化单元(303)对近邻算法分析单元(202)中的K值进行调整,通过将K值进行增加来对模型进行优化处理,K值大小决定了模型对噪声的敏感程度及对异常值的鲁棒性。

全文数据:

权利要求:

百度查询: 江苏冬云云计算股份有限公司 一种基于AI驱动的数据传输威胁检测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。