一种基于SE模块增强ViT模型鲁棒性的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：兰州理工大学

摘要：本发明公开了一种基于SE模块增强ViT模型鲁棒性的方法，包括步骤：使用多种对抗攻击算法生成对抗样本，验证所提出现有的ViT模型的防御方法在面对不同对抗样本时的鲁棒性；将对抗样本输入所提出ViT模型的ConvolutionalTokenEmbedding层，然后再通过归一化层；将S2得到的特征输入SE‑Transformer块，特征首先经过SE模块，然后计算特征的Query、Key和Value值；将步骤S2、S3重复执行，并在最后阶段中添加cls分类标记；使用MLPHead预测最终的类别，计算准确率。本发明利用SE模块突出每个特征图的重要信息，抑制次要信息，有助于模型进行关键特征的提取，强化通道的特征信息，减少无用的特征；同时结合ViT模型的自注意力机制self‑attention可以提取特征的长距离信息。

主权项：1.一种基于SE模块增强ViT模型鲁棒性的方法，其特征在于，包括步骤：S1：使用多种对抗攻击算法生成对抗样本，使用所述对抗样本验证ViT模型的防御方法的鲁棒性；S2：将对抗样本输入现有ViT模型的ConvolutionalTokenEmbedding层，然后再通过归一化层，包括步骤：S21：对于上一个阶段生成的2D图像，使用函数f·将其映射为新的tokensfxi-1，将其作为输入送入下一个阶段i，其中，f·是卷积核大小为s×s的2D卷积操作，步长为s-o，p为填充大小，的height和width计算公式如1所示：其中，H表示高度，W表示宽度，p表示填充大小，s表示卷积核大小，s-o表示步长，i表示不同的阶段；然后，fxi-1被展成HiWi×Ci的形状被送入第i阶段的Transformer块中；S22：ConvolutionalTokenEmbedding通过卷积操作调整token的特征维度和每个阶段的token数量；S3：将步骤S2得到的特征输入SE-Transformer块，包括步骤：S31：对于一张输入特征图X，其大小为W′×H′×C′，经过卷积操作Ftr·,θ得到特征图U，其大小为W×H×C，Ftr的计算公式如2所示：其中，vc表示第c个卷积核，Xs表示第s个输入，uc表示第c个特征图，然后输入SE模块，所述SE模块包括三个组件：Squeeze、Excitation和Scale，其中所述Squeeze是对于大小为W×H×C的特征图U，采用全局平均池化对其进行squeeze操作，结果输出大小为1×1×C的向量，计算公式如3所示：其中，Fsq表示Squeeze操作，H、W分别表示特征图U的高度和宽度；所述Excitation是由两个全连接层与两个激活函数组成，z首先与第一个全连接层W1相乘，此时z的维度变为之后经过ReLU激活函数，学习各个通道的非线性关系；随后经过第二个全连接层W2，此时z的维度变为1×1×C，最后经过sigmoid激活函数，输出结果s，输出结果s计算公式如4所示：s＝Fexz,W＝σW2δW1z4其中，Fex表示Excitation操作，z表示Squeeze操作的输出，W1表示第一个全连接层，W2表示第二个全连接层，δ为ReLU激活函数，σ为sigmoid激活函数；所述Scale是将各通道的权重值分别和U对应通道的矩阵进行相乘，最终得到带有权重信息的特征图，计算公式如5所示：其中，Fscale表示Scale操作，sc表示权重值，uc是一个二维矩阵；S32：SE-ViT操作，将每个Tokens拉伸为2D特征图，然后使用SE模块分别计算Q、K和V值，如公式6所示，然后将映射的tokens拉伸为1D向量，作为tokens输入下一个阶段；其中，是第i层输入token的QKV矩阵，xi是未经过SE模块提取特征的token；S33：添加位置编码；S4：重复步骤S2和S3，并在最后阶段中添加cls分类标记；S5：使用MLPHead预测最终的类别，计算准确率，验证网络模型面对抗样本时的鲁棒性。

全文数据：

权利要求：

百度查询：兰州理工大学一种基于SE模块增强ViT模型鲁棒性的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：拉杆防尘罩自动组装装置

下一篇：一种垂直起降固定翼无人机

相关技术

拉杆防尘罩自动组装装置

一种垂直起降固定翼无人机

血透导管接头保护装置

一种便于取放的医疗背囊

一种电凝冲吸器

一种建筑工程钢材运输装置

一种承载埋嵌铜块过水平棕化线治具

一种小型铸件生产用铸造装置

一种可拆卸式汽车斜坡支架

一种节能注塑机余料回收装置

一种具有接料底的污水自动过滤箱装置

一种带有防护外壳的镍氢电池组

模型相关技术

拼接式趣味航空模型_苏奕豪_202420114195.1

基于大模型的嵌入模型的训练方法、装置、设备及介质_海信集团控股股份有限公司_202410865861.X

基于智能体模型的涡轮冷却器控制模型压缩方法和装置_中国航空工业集团公司金城南京机电液压工程研究中心_202411149596.1

一种模型生成方法、模型生成设备及电子设备_浙江大华技术股份有限公司_202411402408.1

基于几何模型算法和无几何模型算法融合的RTK定位方法_中国电子科技集团公司第五十四研究所_202210256583.9

集成模型训练、时序预测方法和装置、时序预测集成模型_北京百度网讯科技有限公司_202410797406.0

一种基于Transformer模型的代码生成和代码注释的双重模型方法_沈阳工业大学_202410949071.X

一种模型处理方法、装置和用于模型处理的装置_北京搜狗科技发展有限公司_202111301382.8

将数据从RVM格式模型到PDMS三维模型的转换方法_四川电力设计咨询有限责任公司_202411411985.7

神经网络模型的量化方法和量化神经网络模型的装置_三星(中国)半导体有限公司_202011564315.0

ViT相关技术

一种基于ViT的航空图像识别方法_武汉理工大学_202210541111.8

一种基于改进ViT的高效细粒度图像分类模型_吉林化工学院_202410903197.3

基于视觉变压器改进的Fire-ViT隧道火灾预警系统_江西交通职业技术学院_202410964989.1

一种基于SE模块增强ViT模型鲁棒性的方法_兰州理工大学_202210668973.7

一种ViT模型的硬件加速方法、装置、设备及存储介质_山东云海国创云计算装备产业创新中心有限公司_202410977182.1

一种基于多头多尾VIT模型的全方位非均匀低空波导剖面反演方法及装置_中国电波传播研究所(中国电子科技集团公司第二十二研究所)_202410404057.1

一种基于ViT的毫米波无线通信系统覆盖率预测方法_南京大学_202410807901.5

基于ViT的融合高价值局部信息的图像编码方法及系统_山东大学_202410986842.2

一种基于CNN-SPPF和ViT的巴氏涂片宫颈细胞图像分类方法_东北大学_202410227380.6

一种基于ViT机制和面向场景搜索的水下目标检测方法_桂林电子科技大学_202410811421.6

鲁相关技术

基于经验关系偏差纠正的鲁棒人脸超分辨处理方法及其系统_福建师范大学_202210183572.2

无人驾驶车安全运动状态的鲁棒跟踪控制方法_东北大学_202410980399.8

一种高鲁棒性超疏水防冰织物的制备方法_西安交通大学_202211517997.9

一种基于线性拟合的电机鲁棒模型预测控制方法_浙江大学_202411415768.5

基于自适应鲁棒核的单目视觉惯性SLAM方法与系统_江苏科技大学_202111376206.0

一株能产生鲁霉素的李维斯链霉菌L2及其应用_湖南省微生物研究院_202411143393.1

基于鲁棒半监督分类框架的高炉炼铁过程故障诊断方法_浙江大学_202410938311.6

基于对抗优化与反馈连接的强鲁棒图像隐写方法_广西大学_202410924659.X

电-氢-热综合能源系统分布鲁棒优化方法及装置_国网浙江省电力有限公司电力科学研究院_202311335809.5

一种基于压缩感知的鲁棒目标追踪方法_福建水利电力职业技术学院_202411072324.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于SE模块增强ViT模型鲁棒性的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务