首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多尺度特征融合的单目深度估计方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:重庆邮电大学

摘要:本发明涉及一种基于多尺度特征融合的单目深度估计方法,属于三维场景感知领域,包括以下步骤:S1:引入Non‑Local注意力机制,构造混合的归一化函数;S2:在特征提取网络的本层特征、深层特征和浅层特征之间引入注意力机制,计算特征图上特征之间的关联信息矩阵;S3:构建多尺度特征融合模块;S4:在解码网络引入空洞空间金字塔池化模块,扩大卷积的感受野,迫使网络学习更多的局部细节信息。本发明有效的实现了特征提取网络分层特征之间跨空间和跨尺度的特征融合,提高了网络学习局部细节的能力并使深度图在重建过程中完成了细粒度的预测,所引入的参数相对于整个网络来说也相对比较低。

主权项:1.一种基于多尺度特征融合的单目深度估计方法,其特征在于:包括以下步骤:S1:引入Non-Local注意力机制,构造混合的归一化函数;所述步骤S1包括:在Non-Local的基础上,构造混合的SoftMox层作为归一化函数,归一化函数的计算公式如下: 其中是第n个部分的相似度得分,i是特征图上的当前像素点,j是特征图上的所有像素点,πn表示第n个聚合权重,N表示特征图划分的数量,wn是一个网络训练中可学习的线性向量,是对应于特征图X上每个区域kj的算数均值;S2:在特征提取网络的本层特征、深层特征和浅层特征之间引入注意力机制,计算特征图上特征之间的关联信息矩阵;所述步骤S2具体包括以下步骤:S21:通过自转换,利用特征图上的其它特征点kj来对当前特征点qi进行关系建模,计算公式如下: 其中,wi,j表示空间注意力图,Fmos·表示归一化函数,qi,n表示索引,kj,n表示键,表示逐元素相乘,X表示自转换后的特征图,vj表示值;S22:通过自上而下的特征转换,利用高维的语义信息对低维特征的上下文信息进行建模,计算公式如下:wi,j=FmosFeudqi,n,kj,n 式中,Feud·表示特征图上两个像素点之间的欧式距离;S23:通过自下而上的特征转换,在不同尺度的特征图通道之间进行相关信息建模,具体的计算公式如下:w=GAPKQatt=FattQ,wVdow=FsconvV 其中,w表示通道注意力图,GAP表示全局平均池化,K表示网络浅层特征图的键,Qatt表示经过通道注意力加权后的特征,Fatt·代表外积函数,Q表示网络深层特征图的索引,Vdow表示下采样后的特征图,Fsconv·是带步长的3×3卷积,V表示网络浅层特征图的值,表示经过自下而上转换的特征图,Fconv·是用来细化的3×3卷积,Fadd·表示两个特征图进行逐元素相加之后再次通过3×3卷积处理;S3:构建多尺度特征融合模块;所述步骤S3中,对编码网络的中间4层特征分别进行步骤S2中的三种特征转换,得到多个增强后的高级特征,然后对增强后的特征按尺度进行特征重排,将相同大小的特征与编码网络上的原特征进行级联,最后通过一个3×3卷积将增强后特征的通道维度恢复到输入时的相同维度;S4:在解码网络引入空洞空间金字塔池化模块,扩大卷积的感受野,使网络学习更多的局部细节信息。

全文数据:

权利要求:

百度查询: 重庆邮电大学 一种基于多尺度特征融合的单目深度估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。