Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京交通大学曹原周汉获国家专利权

恭喜北京交通大学曹原周汉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京交通大学申请的专利基于多层级跨模态自注意力机制的三维目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114663880B

龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210253116.0,技术领域涉及:G06V20/64;该发明授权基于多层级跨模态自注意力机制的三维目标检测方法是由曹原周汉;李浥东;张慧;郎丛妍;陈乃月设计研发完成,并于2022-03-15向国家知识产权局提交的专利申请。

基于多层级跨模态自注意力机制的三维目标检测方法在说明书摘要公布了:本发明提供了一种基于多层级跨模态自注意力机制的三维目标检测方法。该方法包括利用RGB图像数据构建训练集与测试集;构建三维目标检测模型,该三维目标检测模型包含RGB主干网络、深度主干网络、分类器与回归器;利用训练集与测试集数据训练所述三维目标检测模型,并利用测试集验证训练效果,得到训练好的三维目标检测模型;利用训练得到的模型对RGB图像中的三维目标进行检测。本发明方法从深度特征图中获取全局场景范围内的深度结构信息,与外观信息有机结合以提升三维目标检测算法的准确性,从而有效地对二维RGB图像中的三维物体进行类别、位置、尺寸和姿态等信息的检测。

本发明授权基于多层级跨模态自注意力机制的三维目标检测方法在权利要求书中公布了:1.一种基于多层级跨模态自注意力机制的三维目标检测方法,其特征在于,包括:利用RGB图像数据构建训练集与测试集数据;构建三维目标检测模型,该三维目标检测模型包含RGB主干网络、深度主干网络、分类器与回归器;利用所述训练集与测试集数据训练所述三维目标检测模型,并利用所述测试集验证所述三维目标检测模型的训练效果,所述RGB主干网络、深度主干网络分别获取RGB特征与深度特征,将所述RGB特征与深度特征输入跨模态自注意力学习模块,对RGB特征进行更新,利用更新之后的RGB特征学习分类器与回归器,得到训练好的三维目标检测模型;利用所述训练好的三维目标检测模型中的分类器和回归器对待识别的二维RGB图像中的三维物体进行类别、位置和姿态检测;所述的利用所述训练集与测试集数据训练所述三维目标检测模型,所述RGB主干网络、深度主干网络分别获取RGB特征与深度特征,将所述RGB特征与深度特征输入跨模态自注意力学习模块,对RGB特征进行更新,利用更新之后的RGB特征学习分类器与回归器,得到训练好的三维目标检测模型,包括:步骤S3-1:初始化所述三维目标检测模型中的RGB主干网络、深度主干网络、分类器与回归器所包含的卷积层、全连接层与归一化层中的参数;步骤S3-2:设置随机梯度下降算法的相关训练参数,该相关训练参数包括学习率、冲量、批量大小与迭代次数;步骤S3-3:对于任一迭代批次,分别将全部RGB图与深度图输入至RGB主干网络与深度主干网络,得到多层级的RGB特征与深度特征,构建跨模态自注意力学习模块,将所述RGB特征与深度特征输入到跨模态自注意力学习模块,学习得到基于深度信息的自注意力矩阵,通过所述自注意力矩阵对RGB特征进行更新,利用更新之后的RGB特征学习分类器与回归器,将分类器与回归器用于二维RGB图像中的三维物体的目标检测,通过计算网络估计值与实际标注值的误差得到目标函数值,利用公式1、2和3分别计算三种目标函数值: 其中公式1中的si与pi分别为第i个目标的类别标注与估计概率,公式2中的与公式3中的分别代表第i个目标的二维估计框与三维估计框,gt表示实际标注值,N表示目标总数;步骤S3-4:将所述三种目标函数值相加得到总目标函数值,并分别对三维目标检测模型中的所有参数求偏导数,通过随机梯度下降法对参数进行更新;步骤S3-5:重复进行步骤S3-3与步骤3-4,不断更新三维目标检测模型的参数,直至收敛,输出训练好的三维目标检测模型的参数;所述的将所述RGB特征与深度特征输入跨模态自注意力学习模块,对RGB特征进行更新,利用更新之后的RGB特征学习分类器与回归器,得到训练好的三维目标检测模型,包括:对于任一二维RGB特征图R与二维深度特征图D,假设其维度为C×H×W,其中C、H与W分别为维度、高和宽,将二维RGB特征图R与二维深度特征图D表示为N个C维特征的集合:R=[r1,r2,…,rN]Τ与D=[d1,d2,…,dN]Τ,其中N=H×W;对于输入特征图R构造一个全连接图,其中每一个特征ri作为一个结点,边ri,rj表示结点ri与rj之间的关系,通过二维深度特征图D学习得到边,对当前二维RGB特征图R进行更新,具体表示为: 其中为归一化参数,δ为softmax函数,j为全部与i相关的位置,为更新后的RGB特征,把上述公式写成矩阵相乘的形式: 其中为自注意力矩阵,Dθ,Dφ与Rg的维度均为N×C′;将每一个空间位置的特征矩阵ri当做一个结点,并在全部空间区域内寻找与ri关联的结点,对于深度特征图中的任意结点i,在与i相关的全部结点中采样数量为S的代表性特征: 其中sn为采样得到的特征向量,其维度为C′,为采样函数,所述跨模态自注意力学习模块表示为: 其中n为采样得到的与i相关的结点,δ为softmax函数,dθi=Wθdi,sφi=Wφsi,sgi=Wgsi,与分别为三个线性变换的变换矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京交通大学,其通讯地址为:100044 北京市海淀区西直门外上园村3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。