买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:大连交通大学
摘要:一种基于未知类别感知的水下开放世界目标检测方法,包括如下技术:提出双卷积注意力机制对水下图像进行特征细化,提出未知感知网络区分已知和未知目标,引入选择性搜索获得更多的目标建议框,引入对比聚类学习样本之间的相似性和差异性,有效地区分已知和未知类别,引入增量学习来逐步学习未知目标直至全部识别。步骤如下:输入图像经过含有双卷积注意力机制的特征提取网络进行特征提取;结合选择性搜索技术提供的目标建议框,计算类别分数和边界框调整值;通过非参数建议模块进一步精确这些建议框,经过两次交并比计算,筛选和区分已知类别和未知类别的目标建议框;对这些目标建议框进行分类和边界框回归,准确地识别和定位图像中的目标对象。
主权项:1.一种基于未知类别感知的水下开放世界目标检测方法,其特征在于基于深度学习和计算机视觉技术,针对水下开放世界目标检测对于已知和未知目标的处理,设计的基于未知类别感知的水下开放世界目标检测方法包括如下创新技术方案:方案一、双卷积块注意力机制DoubleConvolutionBlockAttentionMechanism:通过双卷积注意力机制细化水下特征图像,提高目标检测的精确度,使水下机器人能够准确识别和抓取物体;方案二、未知类别感知网络UnknownAwarenessPerceptionRPN:引入未知类别感知网络,有效区分已知和未知类别,实现未知类别目标的检测;方案三、选择性搜索SelectiveSearch:采用选择性搜索技术,生成高质量的候选区域,提高目标检测的精确度;方案四、对比聚类ContrastiveClustering:通过学习样本之间的相似性和差异性,有效区分已知和未知类别,提高目标识别的准确性和鲁棒性;方案五、增量学习Incrementallearning:在两阶段任务中使用增量学习,逐步识别未知目标,适应新出现的类别;基于未知类别感知的水下开放世界目标检测方法,其特征还在于包括如下步骤:步骤一、输入图像进入以ResNet50为主干的特征提取网络,通过双卷积块注意力机制进行特征提取,生成目标建议框,双卷积块注意力机制的计算过程如下:一、输入特征图:表示为X,维度为H×W×C,其中,H是高度,W是宽度,C是通道数;二、通过最大池化和平均池化得到特征图:最大池化结果Mmax=MaxPoolX平均池化结果Mavg=AvgPoolX;三、经过通道注意力模块后的最大池化和平均池化结果:最大池化结果F″max=Conv1×1ReLUConv1×1Mmax平均池化结果F″avg=Conv1×1ReLUConv1×1Mavg其中,Conv1x1为卷积操作,ReLU为激活函数;四、将两个卷积结果相加并应用Sigmoid函数以生成最终的通道注意力图:通道注意力特征图CA=SigmoidF″max+F″avg;五、应用通道注意力后的特征图Xca:Xca=X×CA其中,原始输入特征图为X,通道注意力图为CA,×表示在通道维度上按元素相乘;六、池化操作将每个通道压缩成单个数值,聚合空间信息:最大池化结果平均池化结果七、将两个池化结果在通道维度上连接起来:连接结果八、应用一次7x7的卷积Fspace=Conv7×7Mconcat后使用Sigmoid函数后生成空间注意力图SA:SA=SigmoidFspace九、将空间注意力特征图SA与通道注意力的特征图Xca相乘得到最终结果Xfinal:Xfinal=Xca×SA其中,×表示在空间维度上按元素相乘;步骤二:输入图像通过选择性搜索技术,根据区域的形状、大小和位置等信息,筛选出最有可能包含目标的候选区域,生成目标建议框;步骤三:将步骤一和步骤二生成的目标建议框汇总后,使用对比聚类技术划分已知和未知类别,计算每个锚框的分类分数和边界框回归的坐标调整值,生成精确的目标建议框,用于后续目标检测和分类;步骤四:将步骤三中生成的已知和未知目标建议框通过非参数建议模块进一步精确,减少错误检测数量;步骤五:通过两次交并比IoU计算优化目标建议框的选择,更准确地筛选和区分已知和未知类别的目标建议框,全部类别交并比UKu1和未知类别交并比UKunk计算公式如下:UKu1={b|b∈UKu,IOUb,UKa>0.9}UKunk={b|b∈UKu1,IOUbunk,UKaunk>0.7}其中,b为潜在未知对象,UKu为初步形成的未知建议框集合,UKa为非参数建议模块生成的候选框,bunk为初步筛选后的潜在未知对象,UKaunk为初步筛选后的非参数建议模块生成的候选框;步骤六:最后对目标建议框,进行分类和边界框回归,准确地识别和定位图像中的目标对象。
全文数据:
权利要求:
百度查询: 大连交通大学 基于未知类别感知的水下开放世界目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。