恭喜杭州电子科技大学李平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学申请的专利基于峰值区域自适应扩散的视频时空动作检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116109984B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310138839.0,技术领域涉及:G06V20/40;该发明授权基于峰值区域自适应扩散的视频时空动作检测方法是由李平;叶兴超;徐向华设计研发完成,并于2023-02-09向国家知识产权局提交的专利申请。
本基于峰值区域自适应扩散的视频时空动作检测方法在说明书摘要公布了:本发明公开了基于峰值区域自适应扩散的视频时空动作检测方法。本发明方法首先对原始视频进行采样获得视频帧序列,利用目标检测器和卷积神经网络提取目标边界框元组、视频帧特征和视频时空特征图;利用构建峰值区域挖掘模块得到峰值区域中心位置坐标;再格式塔均值扩散模块,得到修正后的所有目标的目标边界框元组;最后,使用通道池化模块判别视频片段目标所属动作类别以及对动作时长间隔进行修正。本发明方法不仅能够目标大小自适应调节峰值区域尺寸,以尽可能少的目标特征刻画目标轨迹,还能通过格式塔原则均值扩散模块使用稳定的颜色属性挖掘目标完整特征,以提高目标运动特征提取的有效性,从而获得更高的时空动作检测精度。
本发明授权基于峰值区域自适应扩散的视频时空动作检测方法在权利要求书中公布了:1.基于峰值区域自适应扩散的视频时空动作检测方法,其特征在于,对给定动作类别、动作时空标记的视频数据集合,依次进行如下操作:步骤1对视频进行预处理得到视频帧序列,利用二维、三维卷积神经网络以及更快的区域卷积神经网络提取初始目标边界框元组、视频帧特征和视频时空特征图;具体是:1-1以每秒N帧的采样率对视频采样,5≤N≤10,获得含T′帧的帧序列集合表示实数域,Us表示第s帧的帧序列,H′、W′、3分别表示视频帧的高、宽、RGB三通道;1-2将视频帧序列划分为T个视频片段单个视频片段长度为2·N帧,Vt表示第t个视频片段,再将Vt输入至三维卷积神经网络,生成第t个视频片段的时空特征图H、W、2·N分别是特征图的高度、宽度、通道数,由此获得所有视频片段的时空特征图;1-3利用更快的区域卷积神经网络对视频片段的中间帧进行目标检测,获取初始目标边界框元组集合i=1,2,...,Nt,N,中间帧即为视频片段的第N帧;Nt,N表示视频片段Vt中间帧存在的目标数量,表示视频片段Vt中间帧第i个目标的边界框,分别表示视频片段Vt中间帧第i个目标边界框的左上角的横坐标与纵坐标,分别表示视频片段Vt中间帧第i目标边界框的右下角的横坐标与纵坐标;将视频片段Vt的视频帧输入至二维卷积神经网络,获取视频帧特征C为通道数,1<n<2·N;步骤2构建峰值区域挖掘模块,输入为初始目标边界框元组和视频帧特征,输出为峰值区域及其中心位置坐标;具体是:2-1构建峰值区域挖掘模块,获得所有目标的目标边界框中心位置坐标和尺寸,第i个目标边界框的中心位置坐标第i个目标的目标边界框尺寸根据计算高斯核方差值,以调节高斯核尺寸,σ0为预设方差,0<σ0<1,计算坐标x,y下相对于第i个目标的高斯值获得目标i的高斯热图分布以及其他目标的高斯热图分布,通过获得第t个视频片段第N帧的高斯热图分布矩阵;2-2获得峰值区域特征⊙表示对应元素相乘操作,maxpool·表示最大池化操作,参数max·,·表示取最大值;然后对相邻帧计算余弦相似度score=cossimFt,N,peak·Ft,N+1,can,是通过滑动窗口的方式提取区域特征;选择相似度最高的前top-k个且score>δ0的区域,预设阈值0<δ0<1,选择前top-k个区域的交集作为当前帧峰值区域元组分别表示视频片段Vt的第N+1帧第i个峰值区域的左上角的横坐标与纵坐标,分别表示视频片段Vt的第N+1帧第i目标峰值区域的右下角的横坐标与纵坐标,计算当前帧峰值区域中心位置坐标由此得到当前片段所有帧的峰值区域及其中心位置坐标;2-3利用真实结果目标边界框中心位置和峰值区域中心位置,计算定位偏移损失其中表示视频片段Vt第n帧第i个目标的真实目标边界框,||·||1表示l1范数,Nt,n表示视频片段Vt第n帧的目标数量;步骤3建立格式塔均值扩散模块,输入为原始视频帧序列和峰值区域中心位置坐标,输出当前时刻所有目标的目标边界框元组;步骤4构建通道池化模块,输入为视频时空特征图和目标边界框元组,输出为当前时刻与动作相关联的目标以及动作类别;步骤5利用随机梯度下降算法优化由峰值区域挖掘模块、格式塔均值扩散模块和通道池化模块组成的时空动作检测模型,对新的视频序列依次执行步骤1~4得到所有与动作相关联目标在不同时刻的目标边界框和动作类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。