买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国电子科技集团公司第五十四研究所
摘要:本发明属于计算机视觉领域,公开了一种基于特征融合与注意力机制的红外目标检测方法,主要解决现有技术在红外图像目标检测中由于红外图像特征少导致的精度低问题。其方案为:1搭建特征融合与注意力机制的红外目标检测网络;2构建红外图像数据集;3利用构建的数据集对特征融合与注意力机制的红外目标检测网络进行训练,得到训练好的红外目标检测网络;4将待检测的红外图像,输入到训练好的网络中进行检测标注,输出红外目标的检测结果。本发明增强了网络的识别和定位红外能力,保证检测的速度,提高了检测精度,广泛应用于工业、安防、交通等领域。
主权项:1.一种基于特征融合与注意力机制的红外目标检测方法,其特征在于,包括如下步骤:1构建特征融合与注意力机制的红外目标检测网络,按照网络结构连接顺序,依次为:主干网络CSPDarknet53、特征融合网络RFB、颈部网络PANet、注意力网络CAR2和头部网络YOLOHead;其中,主干网络CSPDarknet53用于对输入的红外图像进行初步的特征提取,特征融合网络RFB和颈部网络PANet分别用于加强网络的特征提取能力,注意力网络CAR2用于使网络更关注于目标的特征,头部网络YOLOHead用于最后的目标识别和定位;2构建数据集:收集FLIR红外图像数据集,含有红外图像文件和标注文件,并将红外图像文件数量和标注文件数量按设定比例划分为训练集、验证集和测试集;3利用训练集和验证集对特征融合与注意力机制的红外目标检测网络进行训练,得到训练好的特征融合与注意力机制的红外目标检测网络;4步骤将2所构建的测试集输入到训练好的特征融合与注意力机制的红外目标检测网络中进行检测标注,输出标注有目标框的红外图像,得到红外目标的检测结果;其中,步骤1中主干网络CSPDarknet53的结构关系依次为:输入层→第一卷积层→第二卷积层→第一组合模块CSP1→第三卷积层→第四卷积层→第二组合模块CSP2→第五卷积层→第六卷积层→第三组合模块CSP8→第七卷积层→第八卷积层→第四组合模块CSP8→第九卷积层→第十卷积层→第五组合模块CSP4→第十一卷积层,其中:第一卷积层至第十一卷积层均为CBM卷积层,即由Conv卷积+Bn批量归一化层+Mish激活函数层组成;第一组合模块CSP1,由三个卷积核通道数为64的CBM卷积层和一个CSP残差模块拼接组成;第二组合模块CSP2,由三个卷积核通道数为128的CBM卷积层和二个CSP残差模块拼接组成;第三组合模块CSP8,由三个卷积核通道数为256的CBM卷积层和八个CSP残差模块拼接组成;第四组合模块CSP8,由三个卷积核通道数为512的CBM卷积层和八个CSP残差模块拼接组成;第五组合模块CSP4,由三个卷积核通道数为1024的CBM卷积层和四个CSP残差模块拼接组成;所述五个组合模块,均由两个分支组成,第一分支为第一个CBM卷积层,其输入为上一卷积层的输出,其输出为CSP残差模块,且各CSP残差模块按顺序连接,最后一个CSP残差模块的输出连接第二个CBM卷积层;第二分支为第三个CBM卷积层,其输入为上一卷积层的输出;整个组合模块的输出为第二个CBM卷积层的输出和第三个CBM卷积层的输出concat;所述concat为将两条分支的特征度在通道维度进行拼接;所述CSP残差模块,由两个CBM卷积层顺序连接组成,且第二个CBM卷积层的输出与第一个CBM卷积层的输入相加作为该模块的输出;所述Mish激活函数表示为:Mish=x×tanhln1+ex,式中,x表示上一层的输出,tanh为双曲正切函数。
全文数据:
权利要求:
百度查询: 中国电子科技集团公司第五十四研究所 一种基于特征融合与注意力机制的红外目标检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。