恭喜南京理工大学舒祥波获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京理工大学申请的专利一种基于帧级和特征级增强的半监督动作识别训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116740810B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310660047.X,技术领域涉及:G06V40/20;该发明授权一种基于帧级和特征级增强的半监督动作识别训练方法是由舒祥波;涂哲维设计研发完成,并于2023-06-06向国家知识产权局提交的专利申请。
本一种基于帧级和特征级增强的半监督动作识别训练方法在说明书摘要公布了:本发明公开了一种基于帧级和特征级增强的半监督动作识别训练方法,包括渐进式增强和多头伪标签两部分,使模型在复杂多变的视频场景下仍能学习到鲁棒的动作表征。渐进式增强模块先在帧级对视频片段进行弱强增强,继而在特征级进行特征扰动操作,实现了在更广泛的扰动空间中对无标注视频进行多样性变换,弥补了单一帧级增强变换效果受限的缺陷。多头伪标签模块使得帧级强增强、帧级‑特征级弱增强和帧级‑特征级强增强特征特征与帧级弱增强特征对齐,使多种特征间距离最小化,充分发挥了表征一致性约束以学习到更丰富而鲁棒的动作表征。
本发明授权一种基于帧级和特征级增强的半监督动作识别训练方法在权利要求书中公布了:1.一种基于帧级和特征级增强的半监督动作识别训练方法,其特征在于,包括:步骤1:对无标注视频进行随机采样,获得原始RGB模态和梯度模态视频片段作为输入数据;对两种视频片段分别进行帧级弱增强和帧级强增强,将增强后的片段输入至双模态特征编码器,获得对应的帧级弱增强特征和帧级强增强特征;步骤2:将帧级增强后的特征进行时序平均池化操作,再利用特征扰动器对平均后的特征进行扰动,得到对应的帧级-特征级弱增强特征和帧级-特征级强增强特征;步骤3:将步骤1和步骤2得到的特征分别经过分类头得到相应的类别分布预测,然后将RGB模态和梯度模态分别对应的帧级弱增强类别分布预测进行特征融合后计算伪标签,并获得伪标签置信度大于阈值的伪标签集合,再计算所述伪标签集合内无标注视频的无监督约束损失;步骤4:将有标注视频的类别分布预测与真实标签计算有监督分类损失,并与步骤3得到的无监督约束损失按权重进行相加,得到最终模型损失以优化网络;所述步骤3中,计算所述伪标签集合内无标注视频的无监督约束损失包括:根据帧级强增强特征对应的类别分布预测ps计算帧级强增强流的损失 其中,ps为帧级强增强特征对应的类别分布预测,Bu为一个训练批次中无标注视频数量,为交叉熵损失函数,为伪标签,为RGB模态的帧级强增强特征对应的类别分布预测,为梯度模态的帧级强增强特征对应的类别分布预测;根据帧级-特征级弱增强特征对应的类别分布预测pw_p计算帧级-特征级弱增强流的损失根据帧级-特征级强增强特征对应的类别分布预测ps_p计算帧级-特征级强增强流的损失即: 其中,为RGB模态的帧级-特征级弱增强特征对应的类别分布预测,为梯度模态的帧级-特征级弱增强特征对应的类别分布预测;为RGB模态的帧级-特征级强增强特征对应的类别分布预测,为梯度模态的帧级-特征级强增强特征对应的类别分布预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210000 江苏省南京市玄武区孝陵卫街道孝陵卫街200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。