首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Transformer decoder的工控协议模糊测试用例生成方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:沈阳化工大学

摘要:本发明一种基于Transformerdecoder的工控协议模糊测试用例生成方法,属于工业网络安全领域。该方法包括:1获取测试用例训练集。2训练集预处理。将训练集预处理为序列形式数据,并进行格式处理,以符合Transformerdecoder模型的输入;3学习模型训练。通过训练得到协议格式规范的学习模型;4测试用例生成。5变异算子替换。6反馈调优。监控初始模糊测试响应,根据异常用例聚类构建手动训练集,进行再训练。本发明基于Transformerdecoder模型高效学习工控协议格式,结合区间选择策略和关键字节权重算法实现生成有效、多样且具有针对性的测试用例,提高了模糊测试的效率。

主权项:1.一种基于Transformerdecoder的工控协议模糊测试用例生成方法,其特征在于,所述方法包括以下步骤:S1、获取测试用例训练集:捕获工业场景仿真平台和仿真软件环境的通信流量,分析数据包交互内容,筛选请求数据报文作为训练集;步骤S1的具体步骤为:S101、对捕获的通信数据流量进行分析,确定通信对象之间的应答关系,并从中提取出上位机发送的Query报文,将其保存为只含有请求数据的流量包;S102、重复S101步骤过程,直到收集到数量相当且功能多样的请求数据流量;S2、数据预处理:将请求数据包内容处理为十六进制序列形式数据,通过多种聚类方式进行分类,通过添加空格对每类数据按字节进行划分,将各类样本统一长度,以符合Transformerdecoder模型的输入格式;步骤S2的具体步骤为:S201、将步骤S1筛选的请求报文数据包处理为十六进制字符形式的序列数据;S202、按字节对测试用例样本进行划分,字节数值范围为0-255之间,相邻字节之间以空格切分,以符合模型输入数据格式要求;S203、结合多种聚类策略对样本进行分类,判断测试用例的类型是否足以用于模型训练,如果数量不足则需要通过数据增强技术,生成足够多的测试样本;S204、对测试样本进行标准化处理,统一所有测试样本的长度,假设设置的标准样本长度是t,对于字节数超过t的样本截断至标准,对于字节数不足t的测试样本在尾部添加256填充标志补齐;S3、模型训练:以步骤S2处理后的数据作为模型输入,通过教师强制策略进行训练,使模型充分学习协议内在的格式规范信息,得到基于Transformerdecoder的测试用例生成模型;S4、生成测试用例、自定义初始输入数据内容和长度,模型进行自回归式生成数据;通过区间选择策略自适应调整每个时间步的输出概率区间;S5、变异算子替换:收集公开漏洞数据中可能导致异常的变异算子,构建变异算子库,通过字节重要性算法计算各字节权重,高权重的部分替换对应类型变异算子,构建手动测试用例集合,同时用于训练和模糊测试;S6、反馈调优:进行模糊测试并监控响应信息,标记异常测试用例并聚类,含有标记用例的样本集作为新的训练集进行再训练,重复整个过程,不断更新生成的测试用例;Transformerdecoder学习模型由12层解码器decoder堆叠形成,每层解码器包含嵌入层、因果注意力层、归一化层、前馈网络、残差网络和softmax层组成;嵌入层负责将输入数据嵌入为768维度的高维向量,并添加绝对位置编码赋予数据顺序信息;因果注意力层利用因果注意力机制提取数据特征并使创建掩码矩阵辅助进行教师强制策略训练;前馈网络拓展维度设置为2048,增强模型的表达能力;由softmax层决定最终输出内容选择。

全文数据:

权利要求:

百度查询: 沈阳化工大学 一种基于Transformer decoder的工控协议模糊测试用例生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术