Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于ViT的海上小目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江海洋大学

摘要:本发明属于海上交通智能感知领域,公开了一种基于ViT的海上小目标视觉检测方法,包括:步骤1,选择海上目标数据集,对海上目标数据集进行预处理;步骤2,构建海上小目标检测模型;步骤3,对海上小目标检测模型进行训练、测试、验证,得到最优的海上小目标检测模型;步骤4,将待检测的海上小目标图像传入优化后的海上小目标检测模型中进行小目标检测。本发明采用ViT方式提取图像特征,通过其层次化的Transformer结构能够有效地捕捉不同尺度的特征,这使得它在处理远距离小目标或近距离大目标时都能表现出色;本发明提出基于预测位置信息与分数信息的样本输入权重动态更新策略PRD,以实现小目标的精确检测。

主权项:1.一种基于ViT的海上小目标视觉检测方法,其特征在于,包括以下步骤:步骤1,选择海上目标数据集,对海上目标数据集进行预处理,并将其划分为训练集、测试集和验证集;预处理包括:S1,对海上目标数据集进行多种数据增强,扩充数据集样本;S2,用Copy-paste方法,增加小目标样本数量,具体包括:S201,提取:从扩充后的数据集中选取包含不同海上目标的图像,这些图像具有不同的环境条件;S202,小目标截取:对S201选取的图像进行目标检测和分割,将小目标对象从其原始背景中分离出来,得到纯净的小目标对象图像;S203,背景图像选择:从其他数据源中选取一些只包含水面背景的背景图像,这些背景图像也具有不同的环境条件,以增加数据的多样性;S204,小目标对象粘贴:将S202提取出的小目标对象图像随机地粘贴到S203选取的背景图像上,生成新的合成图像,在粘贴过程中,对小目标对象图像进行随机变换,以模拟不同的视角和姿态;步骤2,构建海上小目标检测模型,所述海上小目标检测模型包括Swin-Transformer、Dynamichead、PRD策略、DINO头部网络;用Swin-Transformer作为海上小目标检测模型的主干网络,提取特征图;用Dynamichead将图像特征进行特征融合;通过PRD策略,增强小目标样本权重;用DINO头部网络进行分类与回归;所述Dynamichead的处理过程分为三个注意力计算过程,分别是尺度注意力、空间注意力和通道注意力,其计算过程为:WF=πCπSπLF·F·F·F其中,W表示注意力计算函数,F代表输入的三维特征张量,πL、πS、πC分别指代特征图的层次、宽高乘积以及通道数,尺度注意力、空间注意力和通道注意力模块分别针对其特定的维度执行注意力操作;所述PRD策略的流程包括:S301,将特征图进行粗检测,生成若干的预检框B,作为后续精细检测的基础,为了确保预测框的准确性,采用平滑L1损失函数LsmoothL1对其进行监督学习,该损失函数计算预测框B与真实标注框之间的差异,这一过程表示为:LsmoothL1B,G=∑i∈{x,y,w,h}smoothL1Bi-Gi其中,B表示预测框的坐标,G表示真实标注框的坐标,i表示坐标的各个维度,即中心点的x,y坐标和宽w、高h,Bi与Gi表示边界框的具体参数,平滑L1损失函数的具体形式可表示为: S302,按置信度选取其中TopK个预检框,并按照它们的位置生成特征权重增强掩码M,这一过程可以为: 其中,i、j表示当前像素的位置,Mi,j表示图像中对应像素位置的权重,Bk表示预检框,指示函数IBKx表示当前位置是否在预检框BK内,若在则置为1,否则置为0;S303,将特征权重增强掩码M归一化并作为权重调整特征,提升特征对预检框区域的响应,其过程可表示为: 其中,Fm表示原始特征图,Fm'表示增强后的特征图,α为超参数,由检测结果设置,用于控制特征响应放大倍数,maxM为特征权重增强掩码M中的最大值;步骤3,通过训练集、测试集和验证集对海上小目标检测模型进行训练、测试、验证,得到最优的海上小目标检测模型;步骤4,将待检测的海上小目标图像传入优化后的海上小目标检测模型中进行小目标检测。

全文数据:

权利要求:

百度查询: 浙江海洋大学 一种基于ViT的海上小目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。