首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于ECAv2-HRNet的人体姿态关键点检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:桂林电子科技大学

摘要:本发明公开了一种基于ECAv2‑HRNet的人体姿态关键点检测方法,包括如下步骤:1)获取通道信息;2)缩减参数;3)合并通道;4)确定交互范围;5)加强特征提取过程;6)双压缩;7)嵌入骨干网络。这种方法在人口密集的环境下精准度高于现有技术中的方法,并且这种方法的模型参数量和需要的浮点运算量皆优于现有技术中的关键点检测方法,这种方法在不同的环境下表现出较为优异的指标性能。

主权项:1.一种基于ECAv2-HRNet的人体姿态关键点检测方法,其特征是,包括如下步骤:1获取通道信息:假设没有降维的聚合特征参数矩阵y∈RC,通道注意力表达式如公式1所示:w=σWy1,公式1的W表示初始特征参数矩阵,σ表示函数映射,w表示转换后的特征信息,Wk表示学习通道注意力信息矩阵,Wk的表达式如公式2所示: w1,1表示通道1,1的特征矩阵,特征图的每个通道都被视作一个特殊的特征检测器,首先,对一个尺寸为H×W×C的输入特征图F进行空间维度的全局最大池化和全局平均池化,得到两个1×1×C的特征图,在空间维度进行池化、压缩空间尺寸,然后,将全局最大池化和全局平均池化的结果,分别送入一个共享的多层感知机MLP中学习,得到两个1×1×C的特征图,MLP的第一层神经元个数为Cr,激活函数为Relu函数,第二层神经元个数为C,最后,将MLP输出的结果进行加权操作,接着经过Sigmoid激活函数的映射处理,最终得到通道注意力权重矩阵MC;2缩减参数:Wk由k×C个参数组成,yi的权重参数是通过yi与yik个邻居之间的交互信息计算如公式3所示: 其中表示yi的k个相邻通道的集合,y表示通道交互信息的集合,使所有通道共享相同的学习参数,如公式4所示: 3合并通道:合并通道通过内核大小为k的快速1D卷积实现,如公式5所示:w=σC1Dky5,其中C1D表示一维卷积,公式5即为高效通道注意ECA机制,C1D只涉及k个参数,当k=3的ECA模块与压缩激励SE模块取得相似的结果;4确定交互范围:局部跨通道交互需要约束范围,即一维卷积内核k的大小,交互的覆盖范围k与通道维度C成正比,在k与C中存在一种映射Φ如公式6所示:C=Φk6,线性函数表征的映射关系有Φk=γ×k-b,扩展到非线性函数,如公式7所示:C=Φk=2γ×k-b7,即给定通道数C,通道交互卷积内核大小自适应的确定如公式8所示: 其中odd表示取公式中最接近绝对值的奇数,分别将γ和b设置为2和1,通过映射Φ,高维通道具有更长的交互范围,低维通道具有更短的交互范围,最终ECANet具有局部跨通道交互的特性,并且交互范围k根据通道C自适应的确定;5加强特征提取过程:设特征参数矩阵MW,H,C具体如式9所示: 其中W、H为特征参数矩阵的宽、高,C表示模型不同通道,按照双压缩通道注意模块ECAv2Net的规则经过一次压缩后得到整个特征参数矩阵的特征值α,α表达式如公式10所示: 特征提取采用双压缩通道ECAv2Net方式;6双压缩:经过一次半压缩得到WP×ΗP×C形状的特征参数矩阵,再经过一次全压缩得到1×1×C形状的特征值β,β的表达式如公式11所示: 公式6中,W、Η表示特征参数矩阵的宽、高,ε、δ表示随机数;7嵌入骨干网络:将注意力模块嵌入骨干网络,ECAv2-HRNet模型的浅层采用ECANet的注意力机制,深层采用ECAv2Net的注意力机制,HRNet为骨干网络,首先通过两个卷积核大小为3x3步距为2的卷积层,后面全部连接BN以及ReLU,共下采样4倍,然后通过Layer1模块,这里的Layer1层和ResNet骨干网络中的Layer1层类似,就是重复堆叠Bottleneck模块,这里的Layer1只调整通道个数,并不改变特征层的尺寸大小,接着通过一系列Transition结构以及Stage结构,每通过一个Transition结构都会新增一个尺度分支,Transition1在layer1的输出基础上通过并行两个卷积核大小为3x3的卷积层得到两个不同的尺度分支,即下采样4倍的尺度以及下采样8倍的尺度,在Transition2中在原来的两个尺度分支基础上再新加一个下采样16倍的尺度,这里是直接在下采样8倍的尺度基础上通过一个卷积核大小为3x3步距为2的卷积层得到下采样16倍的尺度,Stage结构对于每个尺度分支,首先通过4个BasicBlock模块,这里的BasicBlock模块与ResNet骨干网络中的一致,然后融合不同尺度上的信息,对于每个尺度分支上的输出都是由所有分支上的输出进行融合得到的,下采样4倍分支的输出,分别将下采样4倍分支的输出、下采样8倍分支的输出,通过上采样2倍以及下采样16倍分支的输出通过上采样4倍进行相加最后通过ReLU函数得到下采样4倍分支的融合输出。

全文数据:

权利要求:

百度查询: 桂林电子科技大学 一种基于ECAv2-HRNet的人体姿态关键点检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。