Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江大学;杭州一知智能科技有限公司佘清顺获国家专利权

恭喜浙江大学;杭州一知智能科技有限公司佘清顺获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江大学;杭州一知智能科技有限公司申请的专利一种基于对抗多模态领域自适应的跨类别视频时间定位方法、系统和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115035455B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210707517.9,技术领域涉及:G06V20/40;该发明授权一种基于对抗多模态领域自适应的跨类别视频时间定位方法、系统和存储介质是由佘清顺;黄海烽;赵洲;陈哲乾设计研发完成,并于2022-06-21向国家知识产权局提交的专利申请。

一种基于对抗多模态领域自适应的跨类别视频时间定位方法、系统和存储介质在说明书摘要公布了:本发明公开了一种基于对抗多模态领域自适应的跨类别视频时间定位方法、系统和存储介质,属于计算机视觉领域。获取不同类别视频及对应的查询文本,提取视觉特征和文本特征;通过跨模态特征校准器目标类别视频的视觉特征和文本特征进行语义信息校准;通过视频特征重构器对目标类别视频的视觉特征随机掩码并进行视觉特征重构;通过跨模态特征融合器对视频特征和文本特征进行融合;通过领域鉴别器对视频特征和文本特征进行单模态领域不变性特征表达学习,以及对初始融合特征进行跨模态领域不变性特征表达学习;通过双仿射预测器对源类别视频的最终融合特征进行预测。本发明实现了针对跨类别视频的时间定位,提高了模型应对未知目标视频的泛化能力。

本发明授权一种基于对抗多模态领域自适应的跨类别视频时间定位方法、系统和存储介质在权利要求书中公布了:1.一种基于对抗多模态领域自适应的跨类别视频时间定位方法,其特征在于,包括如下步骤:S1:获取源类别视频、目标类别视频及其对应的每一个视频的查询文本,提取视频的初始视觉特征和查询文本的初始文本特征编码后作为最终的视觉特征和文本特征S2:通过跨模态特征校准器对步骤S1得到的目标类别视频的视觉特征和文本特征进行语义信息校准;S3:通过视频特征重构器对步骤S1得到的目标类别视频的视觉特征随机掩码并进行视觉特征重构,得到重构视觉特征;S4:通过跨模态特征融合器对步骤S1得到的视频特征和文本特征进行融合,得到源类别视频的初始融合特征和最终融合特征,以及目标类别视频的初始融合特征和最终融合特征;所述的步骤S4包括:S4-1:计算出步骤S1得到视觉特征和文本特征之间的跨模态相似度矩阵S,其中,k∈{s,t},k=s时,表示源类别视频的视觉特征,为源类别视频的查询文本的文本特征,k=t时,为目标类别视频的视觉特征,为目标类别视频的查询文本的文本特征;S4-2:对步骤S4-1得到的跨模态相似度矩阵S沿行和列分别进行归一化,得到相似性密度矩阵Sr和Sc;S4-3:根据步骤S4-2得到的相似性密度矩阵Sr和Sc,计算得到视频-查询文本注意力矩阵Av和查询文本-视频注意力矩阵Aq;S4-4:根据步骤S4-3计算得到的视频-查询文本注意力矩阵Av和查询文本-视频注意力矩阵Aq计算得到源类别视频的初始融合特征Fk;S4-5:根据步骤S4-4得到的初始融合特征Fk通过多头注意力机制得到最终融合特征S5:通过领域鉴别器分别对步骤S1得到的视频特征和文本特征进行单模态领域不变性特征表达学习,以及对步骤S4得到的初始融合特征进行跨模态领域不变性特征表达学习;S6:通过双仿射预测器对步骤S4得到的源类别视频的最终融合特征进行预测,得到每个查询文本对应的所有可能结果的预测概率,预测概率最大的即为最终的预测结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学;杭州一知智能科技有限公司,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。