首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于SSD算法的车型目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:河北工业大学

摘要:本发明公开一种基于SSD算法的车型目标检测网络及检测方法,该检测网络先在原有的SSD网络基础上引入全局语义提取模块,融合了多个尺度特征图的特征,之后与来自低层特征融合,充分利用全局语义信息和位置信息,提高了车型目标检测的精度;同时设计了多尺度感受野模块增加网络宽度和深度,在网络高层使用不同空间间隔的空洞卷积,有效增强网络特征提取能力,提高网络对目标尺度的适应性。此外,将主干网VGG16后半段以及用于提取不同尺度特征的卷积核数量减半,并把特征提取部分的卷积用深度可分离卷积代替。经过图片数据集的验证,本发明基于SSD网络设计的车型目标检测网络在具备最小计算量和参数量的情况下,具有最高的检测精度。

主权项:1.一种基于SSD算法的车型目标检测方法,其特征在于,该方法基于一种车型目标检测网络,包括以下步骤:步骤1:准备车型数据集1.1收集BDD100K和KITTI开源数据集中的部分车型图片;1.2使用Labellmg标注工具对步骤1.1中收集到的车型图片进行标注;1.3对步骤1.2中完成标注的车型图片采用翻转、镜像、改变明亮度和增加高斯白噪声的方式进行车型图片数量扩容,获得带标签的车型图片数据库;1.4对步骤1.3中带标签的车型图片数据库进行随机划分,将不少于60%的部分划分为训练集,余下部分为测试集;步骤2:训练车型目标检测网络2.1使用训练集对车型目标检测网络进行训练准备VGG16在ImageNet数据集上的预训练权重文件,并将预训练权重文件放至训练代码中,载入SSD神经网络使用的部分VGG网络权重;设置冻结训练的方式训练网络模型,加快训练效率,并防止权值被破坏;初始化车型目标检测网络其余部分的网络参数,输入训练集,当Epoch=50,训练整个车型目标检测网络,设置BATCH_SIZE=16,lr=0.0005;当50Epoch100,训练车型目标检测网络,设置BATCH_SIZE=8,lr=0.0001;车型目标检测网络输出预测的类别、边框位置偏移量和大小偏移量信息;根据车型目标检测网络预测的信息与相应的真实标签计算Loss值,根据Loss下降情况调整学习率参数,直到模型收敛且总训练轮次结束,则车型目标检测网络训练完成;2.2利用测试集对步骤2.1中完成训练的车型目标检测网络进行测试,当该网络的mAP值大于82.52,则该车型目标检测网络为有效网络;步骤3:车型目标检测将拍摄的交通图片尺寸归一化到步骤1中车型图片数据库中图片相同大小后,输入到步骤2.2中测试为有效的车型目标检测网络中,即得该图片中车型目标的位置和类别;所述车型目标检测网络以SSD神经网络为基础,加入CBAM,以及自定义的GSE模块和MSRF模块;并且,将SSD神经网络的VGG16网络骨干部分的Pool2层之后的卷积层和四个特征提取模块的卷积核数量减半,同时将四个特征提取模块的卷积用深度可分离卷积代替;具体的,将VGG16网络骨干部分中的两个卷积层的输出中的Feature1做两种处理,第一种是将Feature1直接输入到DetectorClassifier层,第二种是将Feature1输入到CBAM;CBAM将处理Feature1后得到的特征输入到第一GSE模块;将VGG16网络骨干部分的两个卷积层的输出中的Feature2以及前三个特征提取模块的输出Feature3、Feature4、Feature5组合成两组,Feature2、Feature3、Feature4为第一组特征,Feature3、Feature4、Feature5为第二组特征;将第一组特征和CBAM的输出输入到第一GSE模块,将第二组特征和第一GSE模块的输出输入到第二GSE模块;第一GSE模块将两部分输入进行处理,得到的输出同时输入到第二GSE模块和DetectorClassifier层;第二GSE模块将两部分输入进行处理,得到的输出输入到DetectorClassifier层;同时,第二个、第三个特征提取模块的输出Feature4、Feature5均分别经过一个MSRF模块处理,MSRF模块的输出均输入到DetectorClassifier层,第四个特征提取模块的输出Feature6直接输入到DetectorClassifier层;最后,在后处理时,使用Soft-NMS算法代替原有的NMS算法;GSE模块的输入包含两部分,分别为由三个特征图构成的一组特征和来自另一层的特征;GSE模块在对输入的一组特征处理时,首先使用1×1卷积对其中的两个尺度较大的特征图实施升维操作,升维之后再使用转置卷积将其中的两个尺度较小的特征图上采样至最低层的尺度;然后将处理后的三个特征图在第四个维度时间维度上拼接,并调换通道与时间维度的位置,得到维度为C×T×W×H的4维特征图;然后采用3D卷积网络对4维特征图进行卷积,合并前两个维度便还原成了三维特征图,尺寸为C×W×H;最后将GSE模块的另一个输入下采样后与上述还原后的三维特征图拼接并进行2D卷积,即可获得包含浅层特征和全局上下文信息的新特征层;MSRF模块包括四个分支,其中第一分支的第一层为平均池化层,第二层为1×1的卷积层;第二分支、第三分支、第四分支的第一层均为1×1的卷积层,三者的第二层依次为1×3的卷积层、3×1的卷积层、3×3的卷积层,三者的第三层均为为3×3、Rate为2的空洞卷积层;输入到MSRF模块的特征,分别经过MSRF模块的四个分支的处理,然后将MSRF模块的第一分支的第二层的输出以及第二分支、第三分支、第四分支的第三层的输出进行特征合并,获得新特征层。

全文数据:

权利要求:

百度查询: 河北工业大学 一种基于SSD算法的车型目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术