首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于端云协同的视频处理方法、系统、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:淘宝(中国)软件有限公司

摘要:本申请实施例提供一种基于端云协同的视频处理方法、系统、设备及存储介质。在本申请实施例提供的方案中,端侧部署两个视觉特征提取器,第一视觉特征提取器可提取视频的第一视觉特征序列,第二视觉特征提取器可提取视频的第二视觉特征序列;在端侧部署单模态模型,第一视觉特征提取器和单模态模型相互配合可完成端侧推理,降低云端推理负担,在第一视觉特征提取器能够针对端侧设备进行个性化特征提取的情况下,可进一步提高端侧推理精度;另外,在云侧部署多模态模型,可在单模态模型无法得到符合要求的处理结果时,基于两个视觉特征提取器上传的视觉特征序列进行多模态推理,不仅可以保证视频成功被处理,还可以提高云端推理结果的准确度。

主权项:1.一种基于端云协同的视频处理系统,其特征在于,包括:部署于端侧设备的单模态模型和多路特征提取器,以及部署于云侧设备的多模态模型和提示词生成器;所述多路特征提取器包括第一视觉特征提取器和第二视觉特征提取器,分别用于提取待处理视频的第一视觉特征序列和第二视觉特征序列,并上传至所述云侧设备;所述第一视觉特征提取器是根据其所在端侧设备产生的个性化样本数据训练得到的;所述第二视觉特征提取器是根据多个端侧设备产生的统一化样本数据训练得到的;所述第一视觉特征提取器,还用于将所述第一视觉特征序列提供给所述单模态模型;所述单模态模型,用于根据所述第一视觉特征序列针对所述待处理视频进行目标处理;所述提示词生成器,用于至少根据所述第一视觉特征序列生成软提示词,并输出至所述多模态模型;所述多模态模型,用于在所述单模态模型无法得到符合要求的处理结果时,根据所述第二视觉特征序列生成初始输入特征,并将所述软提示词嵌入所述初始输入特征中得到目标输入特征;根据所述目标输入特征对所述待处理视频进行目标处理。

全文数据:

权利要求:

百度查询: 淘宝(中国)软件有限公司 基于端云协同的视频处理方法、系统、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。