一种基于深度学习的通用椭圆目标检测方法

导航：龙图腾网> 最新专利技术> 一种基于深度学习的通用椭圆目标检测方法

申请/专利权人：东南大学

申请日：2022-07-01

公开（公告）日：2024-07-05

公开（公告）号：CN115049848B

主分类号：G06V10/44

分类号：G06V10/44;G06V10/766;G06V10/82;G06N3/0464;G06N3/047;G06N3/045

优先权：

专利状态码：有效-授权

法律状态：2024.07.05#授权;2022.09.30#实质审查的生效;2022.09.13#公开

摘要：本发明公开了一种基于深度学习的通用椭圆目标检测方法，该方法包括：构建通用椭圆目标检测器；建立基于Anchor‑free目标检测的卷积神经网络结构；使用通用椭圆目标检测数据集训练建立好的卷积神经网络的参数；将待检测图片输入到训练好的卷积神经网络中检测，输出检测结果图。本发明通过Anchor‑free目标检测卷积神经网络能够实现自动、准确地对任意椭圆目标进行检测和定位。

主权项：1.一种基于深度学习的通用椭圆目标检测方法，其特征在于，该方法包括以下步骤：步骤1构建通用椭圆目标检测数据集；步骤2建立基于Anchor-free目标检测的卷积神经网络结构；所述步骤2中建立的基于Anchor-free目标检测的卷积神经网络结构中，我们使用灰度化和拉普拉斯算子的边缘提取作为数据增强方式，使得模型更加关注目标的形状信息；在角度参数回归的损失函数上增加了基于长短轴比值的权重，解决了长短轴比值对角度回归精度的不利影响；在损失函数设计上使用了二维高斯分布的Wasserstein距离来计算真实边界框和预测边界框的相似度，作为损失函数的一部分，提高模型回归精度；同时使用了二值掩膜预测分支，基于多任务学习的硬参数分享的思想，能够进一步优化模型参数，提高回归精度；所述步骤2中：在图片输入到模型网络之前，首先将图片尺寸统一化为512*512，再按照概率p进行灰度化和3*3的拉普拉斯算子边缘提取的数据增强，然后输入到模型的骨干网络DLA-34中进行特征提取，其下采样倍率为4，即输出特征图尺寸为输入图尺寸的14，即128*128，获取的特征的特征图再分别五条并行的输出头，分别预测目标的中心点坐标热图、长短轴、偏移量、旋转角度以及二值掩膜图；在中心点坐标热图回归中，使用FocalLoss作为训练时的损失函数进行参数优化，计算公式如下：其中xyc表示其在特征图中的坐标，α和β是两个超参数，N是关键点数量，Yxyc表示真实标签，表示预测值；真实标签使用高斯核计算，即中心点值为1，越远离中心点值越小；将输出头输出的128*128的中心点坐标热图先通过非极大抑制获取局部最大值，再根据预测分数的大小，选出最大的K个点作为预测目标的中心点；在长短轴回归和偏移量回归中，均使用smooth-L1Loss作为训练时的损失函数进行参数优化，计算公式如下：其输出头输出的是K组长短轴和偏移量；偏移量是用来解决模型在下采样过程中所带来的精度损失；在旋转角度回归中，也使用了smooth-L1Loss作为训练时的损失函数进行参数优化；在此基础上，本模型使用了基于长短轴比值的权重，在损失计算时与角度损失函数相；具体实现为，给定一个阈值，当目标预测长短轴的比值大于该阈值时，将权重置为2，否则权重置为1；从而使模型重视扁长形椭圆目标的旋转角度回归精度，整体计算公式如下：其中，wθ为基于长短轴比值的权重，R为长短轴比值的阈值，θp为旋转角度的预测值，θg为旋转角度的真实值；在二值掩膜预测中，使用二值交叉熵作为损失函数进行参数优化，其真实标签是根据椭圆目标五参数的真实标签变换到14原尺寸而绘制的一系列椭圆掩膜；其输出头输出的特征图为128*128，每个点的值为1或0，1表示目标区域，0表示非目标背景区域；该分支不直接参与椭圆参数的回归，而是基于多任务学习的硬参数分享对模型参数进一步优化，间接提高检测精度；此外在损失函数计算中，本模型还增加了基于二维高斯分布的Wasserstein距离的损失函数；二维高斯分布的由均值和协方差来表示，对于椭圆参数到二维高斯分布的转换，首先均值等于中心点的横纵坐标，协方差矩阵可通过椭圆的长短轴以及旋转角度来表示，具体计算方法如下：μ＝[x,y] 其中，μ和Σ表示二维高斯分布的均值和协方差，x和y是椭圆中心点横纵坐标，a和b是椭圆长短轴，θ是椭圆旋转角度；之后通过Wasserstein距离计算真实边界框与预测边界框的拟合程度，计算公式如下：其中μ1，Σ1和μ2，Σ2分别为预测值和真实值的二维高斯分布的均值和协方差矩阵步骤3使用通用椭圆目标检测数据集训练建立好的卷积神经网络的参数；步骤4将待检测图片输入到训练好的卷积神经网络中检测，输出检测结果图。

全文数据：

权利要求：

百度查询：东南大学一种基于深度学习的通用椭圆目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：汽车的空调总成以及汽车

下一篇：MPCVD新型高功率谐振腔结构及方法

相关技术

汽车的空调总成以及汽车

MPCVD新型高功率谐振腔结构及方法

一种新能源发电预测误差的改进随机算法

基于无监督学习的复合材料纤维信息提取方法、装置和介质

一种基于毫米波雷达的多节点同步通信方法

基于混沌矢量扰动和变换域预编码的融合安全通信方法

一种可实现侧面上下料的车架结构

机器人修复系统和方法

一种业财一体化系统流程节点自动审批的方法

一种卧式双轮电差速舵轮总成

一种镍合金纳米电极及其制备方法与应用

LNG冷能发电一体化绕管式换热装置、方法和发电系统

椭圆相关技术

白盒处理后的椭圆曲线签名方法和系统_上海市数字证书认证中心有限公司_202111627380.8

一种易弯曲椭圆截面介电波导线缆_上海金由电子科技有限公司_202323061411.5

亚像素椭圆中心的检测方法、检测系统、设备和电子介质_湖南科天健光电技术有限公司_202311574991.X

一种基于超椭圆曲面的方变圆收缩段型面的设计方法_中国空气动力研究与发展中心设备设计与测试技术研究所_202410674801.X

一种凸轮-椭圆齿轮组合式包装菜贴标机构优化方法_浙江理工大学_202410595202.9

连铸机生产圆坯时椭圆度的控制方法_中冶京诚工程技术有限公司_202410600950.1

一种基于振荡分量椭圆轨迹的次/超同步振荡的检测方法_四川大学_202211155064.X

一种基于SoC的低功耗椭圆曲线数字签名系统_西安电子科技大学_202210406046.8

一种车载屏幕结构件椭圆特征检测的方法、设备及介质_海微智造技术(武汉)有限公司_202410355898.8

一种椭圆双极化喇叭天线及馈源_中汽研汽车检验中心(天津)有限公司_202410557762.5

通用相关技术

晶舟通用测量夹具_吉盛微(武汉)新材料科技有限公司_202323080614.9

一种通用床身式机床_刘洁_202310489566.4

一种智慧交通用路灯_聊城市市政工程管理服务中心_202323110443.X

一种通用调平组件_浙江亚厦装饰股份有限公司_202323226906.9

多版型边框通用护角_安徽泉为绿能新能源科技有限公司_202323411549.3

一种通用导气垫板_扬宣电子(东莞)有限公司_202323358809.5

一种机械加工通用托架_无锡海勒机械有限公司_202323308802.2

一种风机通用防积水套件_浙江龙信风机有限公司_202323165755.0

一种通用型梁式吊具_唐山掘鑫资源综合利用有限公司_202323343690.4

电子雷管高低压通用激发装置_中北大学_202111426531.3

目标相关技术

车辆及其目标检测方法_比亚迪股份有限公司_202410546925.X

一种目标检测模型构建方法、目标检测方法及相关装置_中国电力科学研究院有限公司_202410523072.8

目标识别模型的训练、目标识别方法、系统、设备及介质_苏州元脑智能科技有限公司_202410846360.7

目标对象的变化识别方法_苏州荟诗科技有限公司_202410379596.4

目标对象控制方法及装置_上海幻电信息科技有限公司_202011528945.2

目标跟踪方法、装置和存储介质_中国农业银行股份有限公司_202110701150.5

目标检测方法、装置及存储介质_小米汽车科技有限公司_202310715788.3

一种目标跟踪处理方法及装置_浙江大华技术股份有限公司_202010754392.6

训练和使用目标检测模型的方法及装置_支付宝(杭州)信息技术有限公司_202210753302.0

基于深度学习的水下目标检测机器人_河南大学_202410602431.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于深度学习的通用椭圆目标检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务