买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开一种面向多页面的Web站点指纹攻击方法,该方法提供Web站点指纹攻击服务。首先构建单页面多页面分类模型,实现对未知混淆流量的区分。接下来针对单页面流量,使用基于深度学习的Web站点指纹攻击方法进行识别。而针对识别出的多页面流量,先基于BalanceCascade算法设计分割点识别方法,对其进行分割。随后对分割出的尾端缺失流量序列以及前端重叠流量序列,分别构建基于残差网络以及多头自注意力机制的指纹识别模型,最终实现对多页面的识别。发明通过利用残差网络和多头自注意力机制提高对多页面的识别准确率,进而提高了Web站点指纹攻击的实用性。
主权项:1.面向多页面的Web站点指纹攻击方法,其特征在于,该方法包括:1单页面多页面区分:首先将网络流量以Tor信元时间方向序列表示,利用时间序列特征,使用卷积神经网络识别未知流量是由访问单个或多个页面产生;所述单页面多页面区分具体包括其具体流程为:11将TCP数据报文还原成Tor信元数据,进一步将流量序列以Tor信元时间方向序列表示;12使用含有三个卷积组的卷积神经网络构建单页面多页面识别模型,并使用sigmoid函数作为激活函数,二分类交叉熵函数作为损失函数;13将网络流量时间序列输入单页面多页面识别模型并获得最终的分类结果;2单页面识别:对于识别出的单页面流量,利用基于深度学习的Web站点指纹攻击方法进行识别;所述单页面识别具体包括:21对于识别出的单页面流量,将流量序列以Tor信元方向序列表示;22基于深度学习构建单页面识别模型,模型通过四个卷积组的叠加完成搭建,并在每个卷积组中加入Droppout层缓解过拟合的发生,使用sigmoid函数作为激活函数,类交叉熵函数作为损失函数;23将单页面流量方向序列输入单页面识别模型并获得第一个站点的识别结果;3多页面分割点识别:对于识别出的多页面流量,首先针对上行数据包提取相关特征,设计模型识别出流量分割点,从而将多页面流量分割为尾端流量缺失的站点A流量序列以及前端流量重叠的站点B流量序列;所述多页面分割点识别具体包括:31对于识别出的多页面流量,将流量中访问站点B的第一个HTTP请求数据包标记为真分割点,其余上行数据包标记为假分割点;32提取分割点前后所有数据包的时间特征和数量特征;33将上行包数据集分为真分割点数据集P以及假分割点数据集N,将P、N以及迭代次数T作为参数输入到算法中,利用P与N的大小计算分类器应该达到的FPR阈值f,即把假分割点误分类为真分割点的概率,如下式所示: 34从假分割点数据集N中随机挑选出与P大小相同的子集Ni,与P合并生成平衡数据集Di,利用平衡数据集Di训练生成XGBoost基分类器,并调整参数θi控制XGBoost基分类器的FPR阈值f,然后将所有判断正确的假分割点样本从数据集N中删除;35重复步骤34过程T-1次,最终生成的分割点识别模型是由多个基分类器集成而得到的,FPR阈值f的确定使得在经过T-1次迭代后,假分割点数据集N中的样本个数如下式所示: 36利用步骤35得到的分割点识别模型得到每个点是分割点的概率,选择概率最大的点作为流量的分割点,在该分割点所对应的数据包之前的流量片段为尾端流量缺失的站点A流量序列,在该分割点之后的流量片段则为前端流量重叠的站点B流量序列;4尾端缺失流量序列识别:分割出的站点A流量序列中不含有其他页面的流量数据包,但是缺失了一部分尾端流量数据包;相对于完整的流量序列,站点A的流量序列长度更短,所能提取的有效特征更少,因此通过增加网络深度来学习更深层次的特征,并引用残差网络来解决梯度消失的问题;所述尾端缺失流量序列识别具体包括:41通过交替添加恒等块以及卷积块的方式构建尾端缺失序列识别模型;42将尾端缺失流量的方向序列输入步骤41构建的模型得到该序列属于每个站点的概率,最终选择概率最大的站点作为预测结果;5前端重叠流量序列识别:站点B流量序列前端含有一部分上一页面的尾端流量数据,因此,首先对流量特征序列进行分组,利用多头注意力机制,对每个组计算注意力权重,最后将注意力权重与原始流量特征序列相乘生成新的流量特征并进行识别;所述前端重叠流量序列识别具体包括:51将前端重叠流量的方向序列输入残差网络得到特征序列;52将步骤51中生成的特征序列按列展平为一维张量,并将其拆分成长度相同的特征块;53利用多头注意力机制,计算特征块与特征块之间的注意力权重,将每个组的特征块乘以注意力权重,最终利用Softmax分类器进行分类。
全文数据:
权利要求:
百度查询: 东南大学 一种面向多页面的Web站点指纹攻击方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。