Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于隐式上下文学习的道路三维目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安电子科技大学

摘要:本发明公开了一种基于隐式上下文学习的道路三维目标检测方法,主要解决现有方法对距离雷达较远的稀疏点云目标和小目标检测精度低,且容易受背景噪声干扰的问题。其实现方案为:对点云数据体素化;搭建稀疏卷积网络;搭建由现有卷积神经网络和检测网络级联组成的区域建议网络RPN;构建隐式上下文学习模块和注意力融合模块,并与现有的检测网络级联组成RCNN网络;构建由稀疏卷积网络、区域建议网络RPN和RCNN网络组成三维目标检测网络;训练三维目标检测网络;将体素化的点云数据输入训练好的三维目标检测网络中,输出目标检测框,得到目标的具体位置和类别。本发明提高了稀疏点云目标和小目标的检测精度,降低了目标的误检率。

主权项:1.一种基于隐式上下文学习的道路三维目标检测方法,其特征在于,包括如下步骤:1从KITTI数据集中选取3712个点云数据场景作为训练集,剩余3769个点云场景作为测试集;2对点云数据体素化:将点云所在空间划分成大小相同的体素,将点云数据按照其空间坐标分配至对应的体素中,根据点云的稀疏特性,体素中的大部分为不包含点云数据的空体素,其余小部分为包含点云数据的非空体素;3采用现有的稀疏卷积网络对非空体素特征进行提取,得到体素特征图,即先将体素特征图在深度维进行压缩,再将其深度维特征融合到通道维特征中,使体素特征图变为鸟瞰体素特征图,并将其转化为体素鸟瞰特征图;4选用现有由卷积神经网络和检测网络级联组成的区域建议网络RPN,通过其卷积神经网络提取体素鸟瞰特征图中的目标特征,得到包含多尺度目标信息的特征图,通过其检测网络获取特征图中的目标信息,预测得到用于对目标进行初始定位的建议框;5构建基于区域的卷积神经网络RCNN:5a建立隐式上下文学习模块:5a1搭建扩展网格点池化子模块:对建议框的尺寸乘以4个不同的扩展系数,得到4个不同尺寸的扩展子建议框,在原始建议框和4个扩展子建议框内分别均匀放置不同数量的网格点,对原始建议框内的体素特征进行网格点池化,并对每个扩展子建议框内的体素特征进行扩展网格点池化,将4个扩展子建议框所得网格点特征进行级联;5a2搭建一个由多头注意力组、全连接层组成的交叉注意力子模块,其中,多头注意力组由2个并联的注意力头组成,每个注意力头的输出特征由查询矩阵、键矩阵和值矩阵通过缩放点积公式计算得到;5a3将扩展网格点池化子模块和交叉注意力子模块级联,组成隐式上下文学习模块;5b搭建由四个卷积子网络构成的注意力融合模块,每个卷积子网络均包括2个卷积层、2个批归一化层和1个非线性激活层,其中非线性激活层采用线性整流单元激活函数ReLU;5c将隐式上下文学习模块、注意力融合模块和现有的检测网络级联,组成RCNN网络;6将现有的稀疏卷积网络、区域建议网络RPN和5构建的RCNN网络级联,组成三维目标检测网络;7训练三维目标检测网络:将体素化的点云数据输入到三维目标检测网络中,利用分类损失函数Lclsp,c、回归损失函数Lregδ,t和置信度损失函数Lconfpconf,IoU'分别计算三维目标检测网络的类别预测概率p与类别标签c的分类损失值losscls、回归预测结果δ与回归标签t的回归损失值lossregr、置信度预测结果pconf与置信度标签IoU'的置信度损失值lossconf,通过初始学习率为0.003,训练轮次为80的Adam_onecycle优化器迭代更新网络的参数,直到网络的分类损失函数、回归损失函数和置信度损失函数收敛为止,得到训练好的网络模型;8对道路三维点云数据进行检测:采用与步骤2相同的方法,对待检测的点云数据进行体素化处理,将所得体素特征输入到训练好的三维目标检测网络中,输出轿车、行人和骑手这些不同目标的三维检测框。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于隐式上下文学习的道路三维目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。