买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及物体位姿估计技术领域,具体为基于多通道注意力机制的物体6D位姿估计方法及系统,包括:S1,语义分割及特征提取,对输入的RGB‑D图像,通过语义分割从输入的RGB图像和深度图像中裁剪出目标物体的彩色图和深度图,并利用相机内参将深度图转换为点云图。本发明中,通过引入位置和通道两个注意力模块,设计了一种多通道注意力机制DA2Net,在关联特征和全局信息重分布方面具有优势,同时增强其捕获局部和全局上下文信息的能力。在DenseFusion的基础上,在特征融合网络和迭代细化网络中添加该注意力机制,增强对局部细节的理解,并从全局信息中推断出被遮挡的部分。
主权项:1.基于多通道注意力机制的物体6D位姿估计方法,其特征在于,所述方法包括以下步骤:S1,语义分割及特征提取,对输入的RGB-D图像,通过语义分割从输入的RGB图像和深度图像中裁剪出目标物体的彩色图和深度图,并利用相机内参将深度图转换为点云图然后使用颜色特征提取网络和几何特征提取网络分别获取颜色特征和点云特征S2,特征融合网络,将所述颜色特征和点云特征作为输入,经过卷积处理,将第一层和第二层卷积的输出通过通道融合分别生成融合特征和融合特征然后,把融合特征F2输入到DA2Net注意力模块中捕捉局部和全局上下文信息,将全局特征分配至由位置和通道注意力聚合而成的特征图上的每个位置,获取图像中的特征信息,经过DA2Net注意力模块强化表示的特征经过两层卷积操作和平均池化之后,输出新的融合特征再将F1、F2和F3在通道维度上拼接生成像素级融合特征S3,位姿估计网络,将上述像素级融合特征F输入到神经网络中进行位姿估计,输出每个像素点的角偏移参数、平移参数和置信度,得到物体位姿。
权利要求:
百度查询: 安徽工程大学 基于多通道注意力机制的物体6D位姿估计方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。