Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于前景背景混淆场景下的小目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明提出了一种用于前景背景混淆场景下的小目标检测方法,包括:将前景背景混淆的待检测小目标图片输入SRN_YOLO模型得到小目标的检测结果;所述SRN_YOLO模型包括输入网络、骨干网络、颈部网络以及头部网络四部分,为YOLOv8模型的改进模型;SRN_YOLO模型相较于YOLOv8模型的改进点为:在骨干网络中的C2f1模块中添加分离全局上下文注意力机制,达到在高度相似的背景中突出小目标位置的目地;在颈部网络中集成残差上下文聚合模块,有效减弱了小目标特征融合中无关背景噪声的干扰;在主干网络与颈部网络同时部署无跨步卷积,通过最小化卷积过程中的特征损失来提高小目标检测精度。本发明能实现前景背景混淆场景的小目标检测,且保证模型检测速度的同时提高检测精度。

主权项:1.一种用于前景背景混淆场景下的小目标检测方法,其特征在于,包括:将前景背景混淆的待检测小目标图片输入SRN_YOLO模型得到小目标的检测结果;所述SRN_YOLO模型包括输入网络、骨干网络、颈部网络以及头部网络四部分,为YOLOv8模型的改进模型;SRN_YOLO模型相较于YOLOv8模型的改进点为:在骨干网络中的C2f1模块中添加注意力机制,所述注意力机制为全局上下文注意力机制或分离全局上下文注意力机制;所述全局上下文注意力机制包括以下步骤2,所述分离全局上下文注意力机制包括以下步骤1和步骤2;步骤1:特征图分离操作;给定一个特征图其中N表示批次数轴,C表示特征图的通道数,H与W表示特征图的高度轴与宽度轴;首先对特征图X进行标准化操作: 其中μ与σ是输入特征图X的平均值与标准差;ε是为了保证除法稳定运行而添加的非常小的正常数;α与β均为可以训练的仿射变换参数;α视为单个特征图的权重值;对α进行归一化,得到归一化的权重值Wα: 其中,C表示特征图的通道数;αi表示第i个通道的可训练仿射变换参数;αj表示第j个通道的可训练仿射变换参数;接下来,将输入特征X输入GN层,进行归一化处理;然后将GN层的输出与权重值Wα相乘,最后,将Wα与GN层输出的乘积结果通过Sigmoid激活函数,将其映射到0,1之间;然后通过包含阈值的Gate门,将阈值设置为0.5,将高于阈值的权重设置为1,将低于阈值的权重设置为0,得到信息权重值ω1;将高于阈值的权重设置为0,将低于阈值的权重设置为1,得到非信息权重值ω2;ω1、ω2根据以下公式获得:ωi,i=1、2=GateSigmoidWαGNX3然后,将输入特征X分别与信息权重值ω1和非信息权重值ω2相乘,从而获得信息量多的特征图和信息量少的特征图步骤2:捕获全局上下文注意力;只将信息量多的特征图输入全局上下文注意力机制,该机制由三部分组成,分别是上下文建模,瓶颈转换和广播元素加法;全局上下文注意力机制的表达式为: 其中,γi表示特征图中的第i个位置经过上述公式后的输出结果;Xi表示特征图第i个位置的输入特征值;Wk1、Wk2分别表示用于线性变换的权重矩阵;ReLU表示激活函数;LN表示层归一化;Wk表示线性变换矩阵; 是全局注意力池的权重; 表示的是上下文建模部分;Wk2*ReLULNWk1.表示瓶颈转换操作;H与W表示输入特征图的高度与宽度;最终,我们将经过GC注意力机制的特征图与信息量少的特征图进行相加。

全文数据:

权利要求:

百度查询: 重庆理工大学 一种用于前景背景混淆场景下的小目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术