首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于深度学习的通用椭圆目标检测方法 

申请/专利权人:东南大学

申请日:2022-07-01

公开(公告)日:2024-07-05

公开(公告)号:CN115049848B

主分类号:G06V10/44

分类号:G06V10/44;G06V10/766;G06V10/82;G06N3/0464;G06N3/047;G06N3/045

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2022.09.30#实质审查的生效;2022.09.13#公开

摘要:本发明公开了一种基于深度学习的通用椭圆目标检测方法,该方法包括:构建通用椭圆目标检测器;建立基于Anchor‑free目标检测的卷积神经网络结构;使用通用椭圆目标检测数据集训练建立好的卷积神经网络的参数;将待检测图片输入到训练好的卷积神经网络中检测,输出检测结果图。本发明通过Anchor‑free目标检测卷积神经网络能够实现自动、准确地对任意椭圆目标进行检测和定位。

主权项:1.一种基于深度学习的通用椭圆目标检测方法,其特征在于,该方法包括以下步骤:步骤1构建通用椭圆目标检测数据集;步骤2建立基于Anchor-free目标检测的卷积神经网络结构;所述步骤2中建立的基于Anchor-free目标检测的卷积神经网络结构中,我们使用灰度化和拉普拉斯算子的边缘提取作为数据增强方式,使得模型更加关注目标的形状信息;在角度参数回归的损失函数上增加了基于长短轴比值的权重,解决了长短轴比值对角度回归精度的不利影响;在损失函数设计上使用了二维高斯分布的Wasserstein距离来计算真实边界框和预测边界框的相似度,作为损失函数的一部分,提高模型回归精度;同时使用了二值掩膜预测分支,基于多任务学习的硬参数分享的思想,能够进一步优化模型参数,提高回归精度;所述步骤2中:在图片输入到模型网络之前,首先将图片尺寸统一化为512*512,再按照概率p进行灰度化和3*3的拉普拉斯算子边缘提取的数据增强,然后输入到模型的骨干网络DLA-34中进行特征提取,其下采样倍率为4,即输出特征图尺寸为输入图尺寸的14,即128*128,获取的特征的特征图再分别五条并行的输出头,分别预测目标的中心点坐标热图、长短轴、偏移量、旋转角度以及二值掩膜图;在中心点坐标热图回归中,使用FocalLoss作为训练时的损失函数进行参数优化,计算公式如下: 其中xyc表示其在特征图中的坐标,α和β是两个超参数,N是关键点数量,Yxyc表示真实标签,表示预测值;真实标签使用高斯核计算,即中心点值为1,越远离中心点值越小;将输出头输出的128*128的中心点坐标热图先通过非极大抑制获取局部最大值,再根据预测分数的大小,选出最大的K个点作为预测目标的中心点;在长短轴回归和偏移量回归中,均使用smooth-L1Loss作为训练时的损失函数进行参数优化,计算公式如下: 其输出头输出的是K组长短轴和偏移量;偏移量是用来解决模型在下采样过程中所带来的精度损失;在旋转角度回归中,也使用了smooth-L1Loss作为训练时的损失函数进行参数优化;在此基础上,本模型使用了基于长短轴比值的权重,在损失计算时与角度损失函数相;具体实现为,给定一个阈值,当目标预测长短轴的比值大于该阈值时,将权重置为2,否则权重置为1;从而使模型重视扁长形椭圆目标的旋转角度回归精度,整体计算公式如下: 其中,wθ为基于长短轴比值的权重,R为长短轴比值的阈值,θp为旋转角度的预测值,θg为旋转角度的真实值;在二值掩膜预测中,使用二值交叉熵作为损失函数进行参数优化,其真实标签是根据椭圆目标五参数的真实标签变换到14原尺寸而绘制的一系列椭圆掩膜;其输出头输出的特征图为128*128,每个点的值为1或0,1表示目标区域,0表示非目标背景区域;该分支不直接参与椭圆参数的回归,而是基于多任务学习的硬参数分享对模型参数进一步优化,间接提高检测精度;此外在损失函数计算中,本模型还增加了基于二维高斯分布的Wasserstein距离的损失函数;二维高斯分布的由均值和协方差来表示,对于椭圆参数到二维高斯分布的转换,首先均值等于中心点的横纵坐标,协方差矩阵可通过椭圆的长短轴以及旋转角度来表示,具体计算方法如下:μ=[x,y] 其中,μ和Σ表示二维高斯分布的均值和协方差,x和y是椭圆中心点横纵坐标,a和b是椭圆长短轴,θ是椭圆旋转角度;之后通过Wasserstein距离计算真实边界框与预测边界框的拟合程度,计算公式如下: 其中μ1,Σ1和μ2,Σ2分别为预测值和真实值的二维高斯分布的均值和协方差矩阵步骤3使用通用椭圆目标检测数据集训练建立好的卷积神经网络的参数;步骤4将待检测图片输入到训练好的卷积神经网络中检测,输出检测结果图。

全文数据:

权利要求:

百度查询: 东南大学 一种基于深度学习的通用椭圆目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。