一种基于语义消歧结构化编码的视频描述方法

导航：龙图腾网> 最新专利技术> 一种基于语义消歧结构化编码的视频描述方法

申请/专利权人：珠海澳大科技研究院;珠海华发实体产业研究院有限公司

申请日：2024-05-08

公开（公告）日：2024-07-02

公开（公告）号：CN118279803A

主分类号：G06V20/40

分类号：G06V20/40;G06V10/80;G06N5/022;G06N3/042;G06N3/0464;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.07.19#实质审查的生效;2024.07.02#公开

摘要：本发明属于计算机视觉领域，公开了一种基于语义消歧结构化编码的视频描述方法。本发明提出通过引入知识图谱等先验知识来构造视频中对象之间的关系（概念语义图），以获得更深层次理解视频语义关系的结构化编码；在概念语义图的基础上，根据视频场景语义的指导，从同一对对象的多种关系中动态学习出最符合当前视频语境的关系来消除对象之间存在的语义歧义问题，以达到语义消歧的结构化编码；提出跨域指导关系学习策略，它通过解析得到描述语句中各对象及其关系来拟合模型中概念语义图的学习，以达到更好的学习视频中各对象及其之间关系。本发明方法可以实现更为准确、全面的视频描述。

主权项：1.一种基于语义消歧结构化编码的视频描述方法，包括如下步骤：S1构建概念语义图：利用知识图谱筛选出设定的视觉概念集及视觉概念之间的关系权值，分割出符合设定的子知识图谱；实例化子知识图谱，即为每个视频样本中的帧构建概念语义图，得到每个视频的概念语义图序列；S2构建基于语义消歧的概念语义图：在概念语义图的基础上，通过视频的场景语义信息去指导模型学习语义消歧对象之间的关系，让模型从每一对对象的多种关系中动态的学习得到符合当前语境的关系，从而获得语义消歧的概念语义图；S3基于概念语义图的图卷积网络学习：将概念语义图序列通过基于概念语义图的图卷积网络进行时序演变过程的学习，实现概念语义图的学习推理，得到视频帧结构化编码序列S4跨域指导关系学习：将人工标注的描述语句解析成表达对象及其关系的语句场景图，通过语句场景图来指导和约束概念语义图的学习；S5语言模型解码：将视频帧特征序列与结构化编码特征序列进行串联作为视频的视觉编码特征序列以补充帧的全局和动作信息；将视觉和音频特征分别输入到两个Transformer模型，并将得到的输出特征进行串联以生成描述语句。

全文数据：

权利要求：

百度查询：珠海澳大科技研究院珠海华发实体产业研究院有限公司一种基于语义消歧结构化编码的视频描述方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种压缩热零气耗干燥机用卧式冷凝器

下一篇：一种轮毂轴承单元信号检测装置

相关技术

一种压缩热零气耗干燥机用卧式冷凝器

一种轮毂轴承单元信号检测装置

一种防滑脱热奄理疗装置

电梯立柱封板倒角设备

用于设备内通信的共存管理的方法、计算设备和系统

一种透气式指尖血氧仪

圆管打磨除锈装置

一种民用机场引导车自动分配场景中生产调度方法及系统

一种匹伐他汀关键中间体的制备方法

一种便于保养的电力变压器

一种基于大模型的企业级搜索结果优化方法、设备及介质

一种凸轮分割器凸轮检测工装

化相关技术

自动化设备_比亚迪股份有限公司_202410882758.6

图案化导电制品_3M创新有限公司_202080030643.4

有机锡簇结构及其制备方法、图案化组合物、图案化方法、图案化薄膜、图案化基底和电子元器件_珠海基石科技有限公司_202410649350.4

模块化植物灯具_深圳市豪恩智能物联股份有限公司_201910646967.X

一种自动化垃圾车及其自动化机械手_路洪鹏_202323379177.0

二次电池的劣化判定系统以及劣化判定方法_美蓓亚三美株式会社_201980049070.7

自动化注意力稀疏化方法、装置、电子设备及存储介质_清华大学_202410432980.6

微服务的自动化测试方法、装置和自动化测试系统_中国邮政储蓄银行股份有限公司_202410450777.1

劣化判定装置、劣化判定方法以及控制程序_欧姆龙株式会社_202080064201.1

用于轨道交通的智能化信息化运输监管系统及方法_中铁三局集团线桥工程有限公司_202011085472.3

结构相关技术

发卷结构_志邦企业股份有限公司_202323453683.X

封装结构_錼创显示科技股份有限公司_202322897224.4

车轮结构_本田技研工业株式会社_202011039765.8

封装结构_日月光半导体制造股份有限公司_202323169598.0

导线结构_日月光半导体制造股份有限公司_202323097542.9

马达结构_姚立和_202323106610.3

连接结构_矢崎总业株式会社_202410118668.X

封装结构_日月光半导体制造股份有限公司_202322825742.5

一种钢结构衔接处的加强结构_张兴慧_202310508236.5

焊接结构体的制造方法以及焊接结构体_株式会社神户制钢所_202311700746.9

编码相关技术

编码器及编码器系统_富士电机株式会社_202410072949.6

自适应预测编码_瑞典爱立信有限公司_202180105041.5

齿轮编码器_台州百力坚电子科技有限公司_202323079691.2

网络编码设计_高通股份有限公司_202080057076.1

用于编码和解码影像的方法_现代自动车株式会社_202410672192.4

使用波编码的并行MR成像_皇家飞利浦有限公司_202080016570.3

图像编码方法、图像解码方法以及装置_株式会社KT_202210143470.8

视频数据编码的设备和方法_夏普株式会社_201980036049.3

视频的编码、解码的方法及装置、存储介质_北京小米移动软件有限公司_202111136232.6

一种带开关功能编码器_广东省天濠电子科技有限公司_202323647089.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于语义消歧结构化编码的视频描述方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务