恭喜浙江工商大学;浙江横店影视城有限公司王勋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江工商大学;浙江横店影视城有限公司申请的专利一种基于视频的单阶段多人二维人体姿态估计方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119091470B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411570528.2,技术领域涉及:G06V40/10;该发明授权一种基于视频的单阶段多人二维人体姿态估计方法及装置是由王勋;于永辉;杨文武;马洪亮;贾杰设计研发完成,并于2024-11-06向国家知识产权局提交的专利申请。
本一种基于视频的单阶段多人二维人体姿态估计方法及装置在说明书摘要公布了:本发明公开了一种基于视频的单阶段多人二维人体姿态估计方法及装置,属于多人二维人体姿态估计领域,通过引入时序信息融合技术对视频序列中的多人人体姿态进行高效建模。首先,本发明对单个视频序列中的多人人体信息进行全面建模,构建了跨帧人体时序信息融合模块,能够有效捕捉和增强目标帧中人体的全局信息,使得在复杂场景下仍能准确识别和定位多个人体。其次,该方法深入建模人体各个关节点的信息,并设计了跨帧关节点时序信息融合模块,专门用于强化同一人在不同帧中相同关节点的信息传递与关联性。这种设计能够显著改善在视频序列中由于运动模糊、遮挡以及对焦不准等原因导致的关节点识别困难,从而使目标帧的关节点预测更加精确和稳定。
本发明授权一种基于视频的单阶段多人二维人体姿态估计方法及装置在权利要求书中公布了:1.一种基于视频的单阶段多人二维人体姿态估计方法,其特征在于,该方法包括如下步骤:步骤1:构建包含人体片段的视频数据集,并将视频帧样本分为目标帧和辅助帧;步骤2:构建多人二维人体姿态估计网络,所述多人二维人体姿态估计网络将目标帧和辅助帧分别进行人体信息提取,并进行空间信息和时序信息融合,输出人体姿态关节坐标;所述人体姿态估计网络包括ResNet-50组成的骨干网络、下采样层、Transformer编码器、姿态解码器、姿态跟踪器和关节解码器;所述骨干网络中包括四个残差块,输入视频帧样本中的目标帧和辅助帧,为每一帧输出4个不同尺度的特征图,将后三个残差块生成的特征图通过卷积层进行下采样后得到下采样特征图,并对后三个残差块生成的特征图和下采样特征图进行通道数统一,统一后的特征图输入到Transformer编码器中;所述Transformer编码器共有6个Transformer层,每层均由一个多尺度可变形注意力网络和一个前馈神经网络组成,对输入的4个特征图进行尺度特征融合,输出4个融合了多尺度特征信息的特征图;所述姿态解码器仅输入视频帧样本中目标帧对应的多尺度特征图,对人体姿态信息进行提取,共包括三层,每层均包括自注意力网络、交叉注意力网络、前馈神经网络和多层感知机;所述姿态跟踪器提取辅助帧对应的人体信息,包括辅助帧人体姿态信息提取和帧间人体姿态时序信息融合,所述辅助帧人体姿态信息提取模块包括三层,其中每一层均包含了一个自注意力网络、一个交叉注意力网络、一个前馈神经网络以及一个多层感知机,帧间人体姿态时序信息融合包括三层,其中每一层包含了两个自注意力网络、一个前馈神经网络以及一个多层感知机;所述关节解码器进一步优化姿态跟踪器的输出,共包括三层,每层包括两个自注意力网络、一个交叉注意力网络、一个前馈神经网络以及一个多层感知机;步骤3:通过分类损失、关节点回归损失构建总损失函数来约束多人二维人体姿态估计网络,训练得到最终的多人二维人体姿态估计网络;步骤4:基于训练完成的多人二维人体姿态估计模型对输入视频片段进行人体姿态估计。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工商大学;浙江横店影视城有限公司,其通讯地址为:310018 浙江省杭州市西湖区教工路149号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。