买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖北工业大学
摘要:本发明针对中心和尺度预测的CentralandScalePrediction,CSP行人检测模型在复杂场景下出现漏检或者误检的问题,提出了一种基于改进的CSP网络的行人检测方法,首先将原主干网络Resnet50替换为Resnet101,使得网络能够更好的提取被其它物体遮挡的特征。其次引入了基于通道和压缩注意力机制的方法,以获得更高的训练速度和检测速度。最后利用非极大值抑制算法形成最优先验候选框数量以及难样本的再训练。经实验表明该算法在cityperson数据集上,严重遮挡和部分遮挡的指标比当前的行人检测算法的性能有所提高,在公共数据集上取得了较好的鲁棒性。
主权项:1.一种基于改进CSP网络的行人检测方法,其特征在于,包括如下步骤:第一步,构建改进的CSP网络,在特征提取模块中采用Resnet101为主干骨架对行人进行特征提取,获得第一特征图;然后引入挤压和激活网络,所述入挤压和激活网络共包含两个模块,首先挤压模块将输入的第一特征图压缩为1X1XC的第二特征图后,其中C表示通道数量,再通过激活模块对每个通道的重要性进行预测,得到不同通道的重要性大小,即权值,然后分别进行降维和恢复维度,最后进行加权操作,将每个通道的权值与第二特征图上对应的通道数相乘;在检测头模块中首先使用3x3的卷积核进行下采样,然后使用3个1x1的卷积核分别对行人中心点、行人尺度以及偏移量预测,在行人尺度预测中生成预测框,最后的输出为3个预测分数的总分值;第一步中特征提取模块,挤压和激活网络的具体实现过程如下;步骤1,以图像I为输入,特征提取模块中所有生成的特征映射用θ表示,Resnet101共获得5个特征映射;步骤2,引用SE注意力机制,将第3-5阶段的特征图X的每个通道权重的集合应用到特征图uc上,具体表达式为:X=θk2 其中X表示第k层输出的特征映射,k取3-5,uc表示X的特征映射,vc表示第c个卷积核,*表示卷积操作,而代表一个通道s的2d卷积核,因此vc也代表由所有通道求和产生的第c个卷积核,c′表示每个不同通道数对应的卷积核大小;步骤3,通过使用全局平均池化来生成基于通道的全局特征图,具体表达式为: 其中zc为全局特征图,H′和W′分别对应特征图的高和宽,Fsq表示压缩操作,i′,j′分别表示特征图的行列号;步骤4,采取sigmoid形式的gating机制来捕获各个通道的信息,具体表达式为:sc=Fexzc,W=σgzc,W=σW2δW1zc5其中δ为sigmoid函数,δ.表示第一个全连接层,而σ为Relu函数,σ.表示第二个全连接层,Fex表示激活操作,g表示全局平均池化,W1、W2分别表示第一个和第二个全连接层上的通道向量,sc表示通过激活操作后的特征图输出,即权重;步骤5,将学习到的各个通道的激活值和全局特征图zc上的原始特征相乘,表达式为: 其中Fscalezc,sc表示权重sc与全局特征图zc之间的通道乘法,sc表示每个通道上的权重值,表示输入特征图X经过SE模块处理后最终的输出;步骤6,将第1-2阶段的特征图和经过SE模块处理后的特征图进行拼接得到θdet,具体表达式为: 其中Fcon.表示不同阶段特征图的融合操作,θdet即为检测头模块的输入;第二步,对构建的改进的CSP网络进行训练,利用训练好的网络对待检测图像进行行人检测。
全文数据:
权利要求:
百度查询: 湖北工业大学 一种基于改进CSP网络的行人检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。