首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多感受野和注意力特征金字塔的轻量级目标检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安电子科技大学

摘要:本发明公开了一种基于多感受野和注意力特征金字塔的轻量级目标检测方法,主要解决存储资源受限设备中检测精度较低及检测速度较慢的问题,其实现方案是:1获取目标检测图像的训练集和测试集;2构建轻量级多感受野模块;3构建注意力特征金字塔;4以FCOS框架为基础,构建由MobileNetv2网络、轻量级多感受野模块、注意力特征金字塔、预测模块组成的深度学习网络,并使用训练集对其进行训练;5将测试集中的图像输入到训练好的深度学习网络,得到目标检测结果。本发明能快速准确地检测出图像中包含的目标,且检测精度高、检测速度快,参数量小,可用于行人检测、人脸识别、智能监控、工业检测。

主权项:1.一种基于多感受野和注意力特征金字塔的轻量级目标检测方法,其特征在于,包括如下:1从网络上获取包含训练集、验证集和测试集的目标检测图像数据集;2以全卷积一阶段目标检测FCOS框架为基础,使用MobileNetv2网络作为主干网络,对图像进行基础特征提取,生成多尺度特征图C3、C4、C5,其分别对应原始图像的8、16、32下采样比例;3构建轻量级多感受野模块,并采用此模块处理特征图C3、C4:3a搭建由标准卷积层、逐通道空洞卷积层、逐点卷积层依次级联组成的空洞残差网络,并将空洞残差网络串行级联三层,构成轻量级多感受野模块;3b设置轻量级多感受野模块对应于第一尺度特征图C3的各层网络的参数,再输入C3到轻量级多感受野模块中,输出第一尺度增强特征图C3′;3c设置轻量级多感受野模块对应于第二尺度特征图C4的各层网络的参数,再输入C4到轻量级多感受野模块中,输出第二尺度增强特征图C4′;4构建注意力特征金字塔:4a采用卷积核大小为1×1,卷积核通道数为1280,卷积核总数为256的卷积层对第三尺度特征图C5进行降维,得到第三尺度降维特征图C5*;4b对第三尺度降维特征图C5*进行最邻近插值上采样,同时采用卷积核大小为1×1,卷积核通道数为96,卷积核总数为256的卷积层对第二尺度增强特征图C4′进行维度变换,并将两者做逐元素相加运算以进行融合,再经过卷积核为3×3,卷积核通道数为256,卷积核总数为256的卷积层,得到第二尺度融合特征图P4;4c对第二尺度融合特征图P4进行最邻近插值上采样,同时对增强的第一尺度增强特征图C3′采用卷积核为1×1,卷积核通道数为32,卷积核总数为256的卷积层进行维度变换,并将两者做逐元素相加运算以进行融合,再经过卷积核为3×3,卷积核通道数为256,卷积核总数为256的卷积层,得到第一尺度融合特征图P3;4d采用卷积核大小为1×1,卷积核通道数为256,卷积核总数为256的卷积层对第三尺度降维特征图C5*进行增强,得到第三尺度增强特征图P5;4e由空间注意力SE调整第三尺度增强特征图P5的各通道特征信息,并经过步长为2,卷积核为3×3,卷积核通道数为256,卷积核总数为256的卷积层,得到尺寸缩小一倍的第四尺度增强特征图P6;4f由空间注意力SE调整第四尺度增强特征图P6的全局特征信息,并依次经过RELU激活层,和步长为2,卷积核为3×3,卷积核通道数为256,卷积核总数为256的卷积层,得到尺寸缩小一倍的第五尺度增强特征图P7;4g将4a~4f得到的特征图P3、P4、P5、P6、P7从下到上依次排列,得到多尺度的注意力特征金字塔;5以全卷积一阶段目标检测FCOS框架为基础,将MobileNetv2网络、轻量级多感受野模块、注意力特征金字塔、预测模块组成深度学习网络;6训练深度学习网络:6a采用ImageNet数据集上的预训练模型初始化MobileNetv2网络,使用正态分布N0,0.01初始化深度学习网络其余各层权重参数;6b预处理训练样本集:调整图像尺寸大小为512×512,并进行数据增强;6c设置深度学习网络训练超参数:将迭代次数设置为72k,MobileNetv2网络的学习率设置为0.00067,其余部分网络的学习率设置为0.002,在第50k、60k次迭代时,学习率缩小为当前学习率的0.1倍,一次输入的图像数batch设置为8;6d将训练样本集中的batch张图像输入到深度学习网络中进行前向传播,得到预测类别和预测框坐标;6e采用自适应训练样本分配策略,为每个预测框分配正负样本;6f使用广义焦点损失函数,计算预测框与对应样本的损失值;6g在深度学习网络中反向传播损失值,利用梯度下降方法更新各网络节点的权重参数,直到损失值收敛,得到训练好的深度学习网络;7目标检测:7a将测试样本集中的图像调整为512×512,依次输入到训练好的深度学习网络进行前向传播,得到每张图像的预测类别和预测框坐标;7b采用非极大值抑制法,筛选重叠的预测框,得到最终的预测类别和预测框坐标。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于多感受野和注意力特征金字塔的轻量级目标检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术