买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海锡鼎智能科技有限公司
摘要:本发明提供一种视频内容的识别方法、系统、设备及介质。方法包括:获取待识别的视频,并从视频中依序提取出所有视频帧;其中,视频帧中具有时间戳;对于每个视频帧:将视频帧输入至变分自编码器模型的编码器模块,提取视频帧中的频谱特征和空间特征,并进行编码,获得视频帧的编码结果;按照各个视频帧的时间戳,将所有编码结果进行拼接,形成视频的类时频谱数据;将类时频谱数据输入至目标检测模型,获得预测结果;其中,预测结果包括视频中目标内容的位置和目标内容的类别;将预测结果映射回视频,从视频中定位出目标内容并标识出目标内容的类别。解决了现有技术中无法实现实时视频识别的问题。
主权项:1.一种视频内容的识别方法,其特征在于,所述方法包括:获取待识别的视频,并从所述视频中依序提取出所有视频帧;其中,视频帧中具有时间戳;对于每个视频帧:将视频帧输入至变分自编码器模型的编码器模块,提取视频帧中的频谱特征和空间特征,并进行编码,获得视频帧的编码结果;按照各个视频帧的时间戳,将所有编码结果进行拼接,形成所述视频的类时频谱数据;将所述类时频谱数据输入至目标检测模型,获得预测结果;其中,所述预测结果包括所述视频中目标内容的位置和目标内容的类别;将所述预测结果映射回所述视频,从所述视频中定位出目标内容并标识出所述目标内容的类别;其中,所述编码结果中既具有对应视频帧的视觉特征,还具有视频帧的频域特征;所述变分自编码器模型包括编码器模块和解码器模块,利用预先获取的视频帧数据集分别对所述变分自编码器模型和所述编码器模块进行交替训练,直至所述变分自编码器模型的损失函数收敛,所述变分自编码器模型训练完成;所述编码器模块的训练过程包括:将预先获取的视频帧数据集进行傅里叶变换,生成所述视频帧数据集的频谱图;将所述视频帧数据集输入至变分自编码器模型的编码器模块,获得所述视频帧数据集的编码结果;基于编码结果和对应频谱图的差异度,计算所述编码器模块的损失函数,并依据所述编码器模块的损失函数调整所述编码器模块的参数。
全文数据:
权利要求:
百度查询: 上海锡鼎智能科技有限公司 视频内容的识别方法、系统、设备和介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。