Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜西安电子科技大学;陕西理工大学王兰美获国家专利权

恭喜西安电子科技大学;陕西理工大学王兰美获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜西安电子科技大学;陕西理工大学申请的专利一种跨层融合改进的YOLOv4道路目标识别算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114565896B

龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210006574.4,技术领域涉及:G06V20/54;该发明授权一种跨层融合改进的YOLOv4道路目标识别算法是由王兰美;王翔宇;王桂宝;廖桂生;王新宽;孙长征设计研发完成,并于2022-01-05向国家知识产权局提交的专利申请。

一种跨层融合改进的YOLOv4道路目标识别算法在说明书摘要公布了:本发明提出了一种跨层融合改进的YOLOv4道路目标识别算法,所用数据集是KITTI道路目标数据集,为了使模型能够更加轻量化的同时还能保持检测精度,本发明方法以YOLOv4为基础网络,借鉴DenseNet的思想,设计了Dense‑SPP跨层空间池化模块和Dense‑特征融合模块,并且对原始模型进行参数剪枝以及削减,设计了轻量化的Dense‑YOLOv4‑Small网络模型,将骨架网络CSPDarknet‑53中CSP模块进行削减,将原本CSP模块中ResUnit的数量统一设置为1个,对网络进行剪枝消除网络的冗余计算,将KITTI道路目标数据集中的“Misc”和“Dontcare”剔除得到KITTI‑7classes道路目标数据集,在该数据集上对YOLOv4、Dense‑YOLOv4、Dense‑YOLOv4‑Small三个模型进行训练,并对比三种模型的检测速度和检测性能;检测结果表明Dense‑YOLOv4‑Small的检测速度大幅度提升,检测精度几乎不变。

本发明授权一种跨层融合改进的YOLOv4道路目标识别算法在权利要求书中公布了:1.一种跨层融合改进的YOLOv4道路目标识别方法,基于KITTI通用数据集的道路目标识别,其特征在于:步骤一、下载当前目标检测领域通用数据集KITTI道路目标数据集,剔除原始KITTI数据集中的“Misc”和“Dontcare”两类数据,创建KITTI-7Classes道路目标数据集,使用该数据集可保证算法检测效果与该领域公开的通用数据集保持一致,构建了使用的道路目标数据集;将测试集、验证集与训练集按照6:2:2的比例划分;KITTI数据集是目前最大的自动驾驶场景下数据集;KITTI包含各种道路场景采集的真实图像数据;KITTI数据集共包含九类,分别为Car,Van,Truck,Pedestrian,Personsitting,Cyclist,Tram,Misc和Dontcare;由于KITTI中有两类为“Misc”和“Dontcare”,分别为“杂乱无章”类和“不关心的”类,这两种类别是无意义的,并且由于这两类没有特定的目标特征,在不同的图片中其“Misc”类包含的物体是不同的,对原始KITTI数据集中的“Misc”和“Dontcare”剔除,形成KITTI-7Classes数据集,将在KITTI-7Classes上进行训练和测试;步骤二、使用标准YOLOv4网络训练并识别和定位道路目标;使用标准YOLOv4网络对基于步骤一道路目标数据集进行训练,下载标准YOLOv4网络并进行编译;为道路目标数据kitti-7classes更改cfg文件夹中kitti7.data文件中的训练集、验证集、测试集目录为下载数据集的地址,指定类别数量与类别名称,并将kitti7.name中的“Misc”和“Dontcare”条目删除;在训练执行的命令中根据精度要求设定迭代次数为100,根据本次实验数据集加载kitti7.data,同时加载yolov4.cfg,程序即可开始训练;保存训练过程中各层的权重文件Q1,作为训练结束后检测的权值输入文件;利用权重文件Q1进行测试,得到均值平均精度MeanAveragePrecision,mAP、召回率Recall与检测时的帧率FramePerSecond,FPS;当目标占据整张图片一半以上大小时,由于实际有效感受野的限制,网络的检测效果并不佳;训练过程具体如下:1构建YOLOv4网络模型,使用Initialization函数进行神经网络各层权值参数的初始化;YOLOv4由四个部分组成,分别是:1Input输入端:指输入网络原始样本数据;2BackBone网络:指进行特征提取操作的卷积神经网络结构;3Neck颈部:对主干网络提取的图像特征进行融合,并将融合后的特征传递到预测层;4Head头部:对图像中的感兴趣目标物体进行预测,并生成可视化的预测框与目标类别;下载标准YOLOv4网络后,对YOLOv4网络使用make命令进行编译,形成可执行文件darknet;为道路目标数据集KITTI-7classes编辑cfg文件夹中kitti7.data文件,将class、train、valid、names字符串改为对应数据集的目录与参数,这样就编辑好了标准YOLOv4网络Input部分需要的参数,在训练执行的命令行中设定epoch后,根据本次实验数据集加载kitti7.data,同时加载yolov4.cfg,程序即可开始训练;程序在运行时会使用Initialization函数进行神经网络各层权值参数的初始化;2从Input部分输入图片数据,经过Backbone部分,最终输出两个尺度的特征图,并使用分类器输出预测框Pb1与分类概率CPx;从Input部分输入图片数据,经过Backbone部分,最终输出两个尺度的特征图,将两种不同尺度的特征图送入特征金字塔网络FeatuerPyramidNetwork,FPN组成的Neck部分,并将融合后的特征传递到预测层中,与此同时Head部分完成目标的分类并输出预测框Pb1与分类概率CPx,其中x为每个分类的索引;3对这些数据进行IoU与NMS后处理,将预测框Pb2与真实框Gtb对比,并使用Adam算法进行神经网络各层权值更新;经过Backbone网络生成的预测框Pb1数量太大,对图片中同一物体有大量检测框存在,造成检测结果冗余;YOLOv4的Head部分会同时完成预测框与其对应的分类概率;对这些数据进行IoU与NMS后处理,得到处理好的数据;这里使用的IoU与NMS为标准YOLOv4的CIoU_loss与NMS;经过这些后处理后就可以得到感兴趣目标的预测框Pb2与其对应的分类概率CPx;同时,使用Adam算法使用后处理过程中得到的loss进行神经网络各层权值更新;4循环执行步骤2和3继续迭代至命令中设定的epoch值,停止训练,输出记录每一层权重与偏移的文件Q1;利用Q1得到的权重与偏移对测试集进行检测,计算得到mAP、Recall与检测时的帧率FPS;按照精度要求设置迭代阈值epoch=100,迭代次数小于阈值时,使用Adam算法进行网络各层权值更新,直到阈值epoch=100停止训练,计算mAP与Recall,输出记录每一层权重与偏移的文件Q1;步骤三、设计Dense-YOLOv4网络模型;在该模型中设计两种跨层融合模块,分别为Dense-SPP模块和Dense-特征融合模块;以YOLOv4为基础网络,将上述两个模块引入到YOLOv4模型中;在骨架网络上采用CSPDarknet-53为特征提取网络,在特征融合网络上,将原始SPP模块换为Dense-SPP模块;同时将路径聚合网络PathAggregationNetwork,PAN结构上的与上一尺度的输出特征图进行融合的单路五层卷积模块换为设计的Dense-特征融合模块;网络的检测器方面,采用原始设计的三尺度检测,网络的输入尺寸为640×640×3,最终检测层特征图大小分别为20×20、40×40和80×80,分别检测大中小目标;a设计一种Dense-SPP模块,在原始SPP模块的基础上引入跨层连接模块,这样特征图分为两个分支,其中一个特征图进行原始SPP模块卷积、池化操作,另一个特征图进行1×1×512单次卷积,然后两个分支的输出特征图进行Concat拼接操作;Dense-SPP模块的卷积核的数量为11264,而原始SPP模块的卷积核的数量为20480,相比之下参数量减少了45%;设计的Dense-SPP模块同样是采用5个CBL模块,不同之处在于增加一个跨层连接,融合了之前卷积的信息,保留了更多的原始信息;其次,网络具有层次性,也就是说对于同一个任务,不同样本用不同种类的特征就可以完成检测;浅层网络提取的是简单的特征,包括纹理特征,而不同的样本需要不同复杂程度的特征来进行判断,没有Concat拼接操作时,网络没有保存前面浅层网络提取的特征;加入Concat拼接操作后,相当于又在输出上拼接了模块第一层的特征信息,变得有效;b设计一种Dense-特征融合模块,进入Dense-特征融合模块,特征分为两个分支,其中一个特征图进行四次卷积,卷积核大小分别为1×1×256、3×3×256、1×1×256、3×3×256,另一个特征图进行1×1×256单次卷积,然后两个分支的特征进行Concat拼接操作;与原始YOLOv4中的单路五次卷积相比Dense-特征融合模块的计算量会更少,卷积核参数的数量为5376,而单路五次卷积的卷积核参数的数量为9984,相比之下计算量减少了40%;由于每做一次卷积都会浪费掉一些信息:激活函数的抑制作用、卷积核参数的随机性,此跨层连接相当于把以前处理过的信息直接再拿到现在一并处理,起到了减损的效果;并且Concat拼接操作,相当于又在输出上拼接了模块第一层的特征信息,实现了特征复用;密集跨层连接模块每一层的输出都会和后面所有层建立输入输出关系,而每一层的输入都是前面所有层的累加,这种模式可以把网络浅层的简单特征保留到网络深层,与高语义特征进行融合,可以实现特征复用;这种模可以减少网络的参数量;后续的网络层获得损失函数的梯度和原始的输入信号,使得网络包含了隐式的深度监督,进而容易训练更深的网络同时具有正则化的效果,缓解了训练过程中的梯度消失问题;步骤四、将步骤二与步骤三模型性能的检测结果进行对比,包括模型检测精度、模型检测速度、模型检测召回率、模型权重文件大小,并查看步骤二与步骤三实际检测的数据集中的图像,分析检测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学;陕西理工大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。