恭喜重庆大学沈志熙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜重庆大学申请的专利一种基于混合注意力机制的目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116704236B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310492347.1,技术领域涉及:G06V10/764;该发明授权一种基于混合注意力机制的目标检测方法是由沈志熙;李俊北;吴玥;金其坚;张洪田设计研发完成,并于2023-05-05向国家知识产权局提交的专利申请。
本一种基于混合注意力机制的目标检测方法在说明书摘要公布了:本发明涉及基于混合注意力机制的目标检测方法,包括获取现有数据集,构建多尺度道路场景目标检测模型,该模型是在小目标检测模型MS‑YOLOv5基础上进行的改进;MS‑YOLOv5以YOLOv5的主干特征提取网络作为基础模型,对其中的几个模块进行替换;以MS‑YOLOv5为基础模型,其中的模块进行替换并加入混合注意力机制MSCA;对输入数据集数据引入数据重采样操作,并进行训练,待最优收敛后保存模型参数得最优小目标检测模型;调用最优小目标检测模型,输入测图片进行检测,输出即为识别的结果。通过实验验证结果得出该方法提升了检测精度,同时改善了拥堵场景下存在漏检的情况。
本发明授权一种基于混合注意力机制的目标检测方法在权利要求书中公布了:1.基于混合注意力机制的目标检测方法,其特征在于,包括如下步骤:S1:获取现有数据集,并对数据集进行预处理,经过预处理后的所有图片构成训练集;S2:构建多尺度道路场景目标检测模型MSAT-YOLOv5,所述MSAT-YOLOv5是在小目标检测模型MS-YOLOv5基础上进行的改进;S21:所述MS-YOLOv5将基于通道重组的轻量化逆瓶颈残差模块shuffle_res2net_s与YOLOv5主干特征提取网络中CSP_BottleNeck里的残差结构进行替换,定义为MSL_backbone模型;将改进的多尺度空洞空间金字塔池化模块Imp_ASPP与YOLOv5中的空间金字塔池化模块SPP进行替换;所述改进的多尺度空洞空间金字塔池化模块包括:所述Imp_ASPP的输入特征图为X∈RC×H×W;将输入特征图分为5个分支,第一个分支采用卷积核大小为1×1进行卷积操作;对于第2-4个分支以不同采样率的深度可分离空洞卷积并行采样获取不同尺度的图像上下文信息,并在每个深度可分离空洞卷积后面采样通道洗牌操作;对于分支的输入方面,将前一个分支的输出,与本分支的输入进行拼接作为本分支的输入;同时对于分支的输出方面,将前一个分支的输出,与本分支的输出进行拼接作为本分支的输出;将第5个分支首先经过一个自适应均值池化,然后经过一个1×1的卷积层,最终将特征图从1×1的大小上采样回原来的尺寸;将5个分支的输出X'i=RC×H×W,其中i=1,2...5在通道层面进行Concat拼接,再利用Conv1×1进行降维恢复到原来的通道数量,最终得到输出特征图Y∈RC×H×W;将改进后用于改善小目标检测性能的模块CONV_NS用于替换YOLOv5网络中的下采样模块;所述改进后用于改善小目标检测性能的模块CONV_NS包括:所述CONV_NS的输入特征图为X∈RC×H×W;经过卷积核大小为3×3,stride=1的卷积进行特征的提取,不改变输入特征图的空间大小,先将通道维数缩小至原来的12,变为C2,得到特征图X'=RC2×H×W;对特征图X'=RC2×H×W进行重塑操作;特征图变为X”=RC2×new_h×scale×new_w×scale,new_h、new_w为之后新生成特征图的高和宽,scale为缩放尺度;对X”进行transpose转置操作成X”'=RC2×scale×scale×new_h×new_w;转置操作成后再进行重塑操作成Y∈R2C×new_h×new_w,在通道维度进行拼接,使得通道维数变为原来的2倍,同时特征图的空间大小缩小为原来的12;S22:将MS-YOLOv5为基础模型,MS-YOLOv5主干网络中的每个CSP_Bottle2Neck中的shuffle_res2net_s结构都替换为ATTShuffle_res2net_s结构,定义为CSPAT_Bottle2Neck;所述ATTShuffle_res2net_s包括:所述ATTShuffle_res2net_s输入特征图为X∈RC×H×W,经过分层的特征信息的提取,最后得到输出特征图yi,其中i∈1,2,3,4,X表示输入特征图,C为输入通道,H为特征图高度,W为特征图宽度;对输出特征图在通道上进行拼接,通过卷积核大小为1×1的卷积操作进行特征信息的融合和通道维度的降维,然后采用CA.注意力机制操作,最后将经过注意力增强过的特征图与最开始的输入特征图进行元素级相加;将混合注意力机制MSCA与MS-YOLOv5中的路径聚合网络PANet进行融合;所述混合注意力机制MSCA包括:输入特征图为X∈RC×H×W;经过多个卷积核大小为3×3的深度可分离空洞卷积DWATConv3×3.进行多尺度特征的提取,采样率分别为1,2,3,4,经过多尺度特征提取后的特征图为Xi∈RC×H×W,其中i∈1,2,3,4;之后将各个特征图进行元素级相加融合;对融合后的特征图进行CA注意力机制进行增强,用CA.表示;将得出的高和宽的权重系数gh,gw相乘并送入Softmax层进行处理;将经过Softmax处理后得到的输出与前面4个深度可分离空洞卷积的输出特征图进行分别相乘,得到4个输出特征图;最后将4个输出特征图进行元素级别的相加融合,并与最开始的输入特征图进行元素级相加实现对原始特征图的注意力加权操作,得到输出特征图Y∈RC×H×W;S3:对输入数据集数据引入数据重采样操作,并进行训练,待最优收敛后保存模型参数得最优小目标检测模型;S4:调用最优小目标检测模型,输入测图片进行检测,输出即为识别的结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。