基于自进化扰动机制的长视频文本描述方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西北工业大学

摘要：本发明提供了一种基于自进化扰动机制的长视频文本描述方法，通过在transformer编码器中引入自进化扰动机制，有效捕捉了长视频中的关键信息，采用端到端的一阶段框架，通过自进化扰动机制直接从原始视频中提取关键信息，无需事先进行事件提取，因此大大提高了处理效率，满足了实时处理的需求，通过在transformer解码器中引入层间自进化扰动，增强了模型对长视频中长程和短程依赖的建模能力。本发明通过自进化扰动机制有效解决了一阶段视频描述框架面临的关键问题，在提高生成文本质量的同时，兼顾了计算效率和实时性需求。这些优势使得本发明在智能视频理解、视频摘要、视频检索等多个领域具有广阔的应用前景。

主权项：1.一种基于自进化扰动机制的长视频文本描述方法，其特征在于包括下述步骤：步骤1：一个长视频首先被分成若干个不重叠的视频片段，对于每一个视频片段，经过预训练的3DCNN卷积神经网络后，提取得到一个特征图，其中表示视频片段的数量，表示第一个视频片段提取得到的特征,表示第二个视频片段提取得到的特征,表示第L个视频片段提取得到的特征；步骤2：利用transformer编码器对提取的视频片段的特征图进行编码；将每个视频片段得到的特征图都作为一个token输入到transformer的编码器中，得到编码后的视频特征为：；其中表示前馈神经网络，表示多头注意力机制；步骤3：在解码器部分引入了自进化扰动机制，包括层内扰动和层间扰动两个方面；在解码器的每一层自注意力计算时，通过可学习的扰动项自适应调整注意力权重分布，使其更关注对当前生成词语重要的视频片段；同时，利用解码器不同层次的特征感受野差异，通过自蒸馏损失函数促进不同层次特征的融合，以捕捉视频的长程和短程依赖；步骤4：加入扰动的目的是为了以自进化的方式识别出长视频中的关键帧，所以更重要的视频片段的移除对最终损失的影响应该越大，使用负的MLE损失对扰动生成器进行更新，扰动损失为：；其中,表示视频段落描述的损失函数，表示扰动生成器的参数，为平衡正则项和扰动损失的超参数，正则项用来稳定训练过程；步骤5：在得到解码器第t个时间步的扰动项后，扰动项指导原始的注意力权重分布的调整，从而更好地捕捉到长视频中的关键帧；步骤6：在步骤4中进行了层内的扰动后，利用transformer解码器不同层学习到的信息差异，进行层间的自进化扰动；由于transformer的浅层倾向于捕捉短程依赖，而深层能够建模更长远的依赖关系，因此通过层间的信息交互和融合，增强模型对长视频中长程和短程关系的建模能力；步骤7：最终，将自蒸馏损失与原始的交叉熵损失相加，得到总的训练目标为：；其中，为交叉熵损失，为自蒸馏损失，为平衡两个损失项的权重系数；通过联合优化两个损失函数，使模型在生成准确、连贯的文本描述的同时，能够自适应地挖掘长视频中的关键信息，提高生成文本与视频的相关性。

全文数据：

权利要求：

百度查询：西北工业大学基于自进化扰动机制的长视频文本描述方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种纸箱印刷后油墨快速干燥装置

下一篇：一种基于无人车辆的视频控制装置

相关技术

一种纸箱印刷后油墨快速干燥装置

一种基于无人车辆的视频控制装置

一种钣金件喷涂生产线

一种具有定位安装功能的护栏

一种简易灌肠装置

垂直度检测装置

吸管杯及其杯盖

一种传感式诊脉仪

一种冷却塔外壳拼装结构

一种无纺布成卷机

一种基于PWM的智慧路灯控制装置及系统

电缆耐压测试机构

视频相关技术

视频处理电路、视频处理方法和电子设备_维沃移动通信有限公司_202111626915.X

视频编码器_深圳东方凤鸣科技有限公司_202310647043.8

视频采集器_深圳市海盈智联实业有限公司_202323443226.2

车用视频处理装置_北京圣锐斯科技有限公司_202420182280.1

新型煤矿视频监控装置_葳泽迩信息技术(西安)有限公司_202322921688.4

视频解码方法和设备以及视频编码方法和设备_三星电子株式会社_202410851688.8

视频解码方法和设备以及视频编码方法和设备_三星电子株式会社_202410851210.5

一种视频数据的存储、视频回放方法、装置及其设备_杭州海康威视系统技术有限公司_202410841297.8

视频编码的方法、视频解码的方法、装置及存储介质_腾讯美国有限责任公司_202180086139.0

视频播放控制方法、视频播放方法、装置及终端设备_圆周率科技(常州)有限公司_202411072039.4

长相关技术

一种长链二羧酸的结晶方法及长链二羧酸的精制方法_中国石油化工股份有限公司_202011594403.5

长链二羧酸的结晶方法及长链二羧酸的精制方法_中国石油化工股份有限公司_202011594439.3

一种长输管道泄漏监测装置_国家石油天然气管网集团有限公司_202410851132.9

一种长焦距红外连续变焦镜头_南京中锗光电科技有限公司_202420259797.6

长链二羧酸的精制方法_中国石油化工股份有限公司_202011594437.4

测试装置、长晶炉及测温方法_北京旭灿半导体科技有限公司_202410541164.9

一种长轴快速加工工装_江苏宏宝锻造股份有限公司_202323263768.1

一种长吻鮠幼鱼投喂装置_淮南市蔡城塘渔业发展有限公司_202323317079.4

长板构件胶带连续包绕装置_丹东科亮电子有限公司_201910592935.6

一种长链非编码RNA及其应用_北京市肿瘤防治研究所_202410705614.3

机制相关技术

用于无线通信的信号机制确定_中兴通讯股份有限公司_202280089798.4

一种机制砂颗粒风化程度检测方法_中建西部建设湖南有限公司_202410642861.3

一种机制砂制备用生产破碎装置_洛阳职业技术学院_202410949854.8

一种机制砂混凝土配比装置_河南省公路工程局集团有限公司_202323647415.1

一种应用于机制砂的振动筛除尘过滤装置_湖北楚新矿业有限公司_202323365285.2

基于电能量和电力调节的虚拟电厂交易机制确定方法_三峡集团浙江能源投资有限公司_202410874564.1

基于注意力机制的电厂场景多模态数据协同校准方法_大唐三门峡发电有限责任公司_202410602476.6

具有自动光学校准机制的导航系统及其操作方法_泰为股份有限公司_202410232397.0

一种考虑碳交易机制的综合能源系统低碳经济运行方法_河北工业大学_202410733745.2

基于需求响应和碳交易机制的虚拟电厂协调优化调度方法_国网辽宁省电力有限公司营口供电公司_202410565982.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于自进化扰动机制的长视频文本描述方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务