首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向交通场景的行人检测方法 

申请/专利权人:东北大学

申请日:2024-02-29

公开(公告)日:2024-07-05

公开(公告)号:CN117809289B

主分类号:G06V20/58

分类号:G06V20/58;G06V40/10;G06V10/25;G06V10/44;G06V10/52;G06V10/764;G06V10/766;G06V10/77;G06V10/80;G06V10/82

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2024.04.19#实质审查的生效;2024.04.02#公开

摘要:本发明属于计算机视觉应用技术领域,公开了一种面向交通场景的行人检测方法。建立行人检测模型,采用有监督的学习方法进行训练;训练时根据检测结果调整行人检测模型中卷积核的权重,训练完成后的行人检测模型用于检测识别。使用跨阶段网络结构和设计新的残差模块以改进原有的骨干网络,减少算法所需的计算量,采用、设计特征增强模块和自适应融合金字塔结构,提高不同尺度行人目标的检测精度。同时,该方法中也设计了加权式Soft‑NMS的后处理方法以提升行人间遮挡的检测效果。实验结果表明,本发明可以在满足实时检测的需求下提高行人目标的检测精度。

主权项:1.一种面向交通场景的行人检测方法,其特征在于,建立行人检测模型,采用有监督的学习方法进行训练;训练时根据检测结果调整行人检测模型中卷积核的权重,训练完成后的行人检测模型用于检测识别;所述行人检测模型包括用于特征提取的骨干网络、瓶颈结构和检测头;骨干网络部分在Darknet-53的基础上引入跨阶段局部网络结构,设计Inception-Resblock模块替换骨干网络部分原残差模块;瓶颈结构部分包括特征增强模块FEM和使用融合注意力模块FAN的自适应融合特征金字塔结构;所述骨干网络部分中的Inception-Resblock模块为两支路,分别为第一支路和第二支路;第一支路为一个1×1卷积层和一个3×3卷积层;第二支路为一个1×1卷积层和两个3×3卷积层;原始输入分别通过两支路输出,输出结果拼接后使用1×1的卷积调整后再与原始输入相加;所述融合注意力模块以加权的方式对自适应融合特征金字塔结构中每一层的特征图进行调整;融合注意力模块FAN首先将上一层处理后的最终特征图P′i+1进行二倍的上采样操作,之后与当前层的特征C′i合并后,进行3×3的卷积操作提取特征信息,再使用1×1的卷积操作降维;经过全局平均池化后得到N×1×1维的向量,经过Sigmoid激活函数得到最终的权重向量;最终的权重向量与上一层的中间特征图Mi+1进行点乘操作,得到最终包含融合权重注意力的特征图;融合注意力模块整个过程描述为: 其中,F是最终包含融合权重注意力的特征图,σ为Sigmoid函数,GAP为全局平均池化操作,Conv为卷积操作,P′i+1表示自适应融合特征金字塔结构中第i+1层处理后的特征图,C′i表示骨干网络从底到上结构中的第i个特征图;Conca表示拼接操作;表示点乘操作;Mi+1表示自适应融合特征金字塔结构从顶到下结构中的第i+1个特征图;待检测的图片经骨干网络进行特征提取,得到特征图;将骨干网络中最后一层生成的特征图送入特征增强模块;特征增强模块处理后的特征图、骨干网络中倒数第二层的特征图、骨干网络中倒数第三层的特征图分别送入到自适应融合特征金字塔不同网络层中;通过检测头分别对经自适应融合特征金字塔融合后的特征图进行预测,得到最终的分类结果和回归结果。

全文数据:

权利要求:

百度查询: 东北大学 一种面向交通场景的行人检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。