基于无标注网络视频数据的多模态预训练方法及系统

导航：龙图腾网> 最新专利技术> 基于无标注网络视频数据的多模态预训练方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院);北京达佳互联信息技术有限公司;山东大学

摘要：本发明属于视频数据处理技术领域，为解决数据数量、多样性和质量三者无法同时兼顾的问题，提供了一种基于无标注网络视频数据的多模态预训练方法及系统。其中，基于无标注网络视频数据的多模态预训练方法包括：利用大语言模型和图像‑文本模型对视频数据集进行初步细化，生成初步的训练数据集，再引入噪音控制损失函数下，初步训练视频‑语言大模型，作为前一阶段训练得到的视频‑语言大模型；在前一阶段训练得到的视频‑语言大模型未训练完成时，利用前一阶段训练得到的视频‑语言大模型对视频数据集迭代细化，再引入同样噪音控制损失函数下，迭代训练视频‑语言大模型，直至训练完成。其提高了视频中的语音与字幕对应关系识别准确性。

主权项：1.一种基于无标注网络视频数据的多模态预训练方法，其特征在于，包括：获取视频数据集，利用预设大语言模型和图像-文本模型对所述视频数据集进行初步细化，生成初步的训练数据集，再引入噪音控制损失函数下，初步训练视频-语言大模型，作为前一阶段训练得到的视频-语言大模型；判断前一阶段训练得到的视频-语言大模型是否达到设定要求，若是，则结束训练；若否，则利用前一阶段训练得到的视频-语言大模型对所述视频数据集进行迭代细化，并更新训练数据集，再引入同样噪音控制损失函数下，迭代训练视频-语言大模型，直至训练得到设定要求的视频-语言大模型，以利用最终训练完成的视频-语言大模型来识别视频内容中的语音与字幕对应关系。

全文数据：

权利要求：

百度查询：哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 北京达佳互联信息技术有限公司山东大学基于无标注网络视频数据的多模态预训练方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于电池容量的检测方法

下一篇：一种水稻种子处理装置

相关技术

一种用于电池容量的检测方法

一种水稻种子处理装置

一种负压风机末端多级除臭系统

一种安全防滑型踏步板

一种定位加工夹具组件

筑路机

一种埋地管道防腐层破损检测装置

一种编队无人机快速移动摆放装置

新型可聚合液晶

悬挂式生物质往复炉排

地铁站台无障碍上下车装置

一种水利河道拦污防汛装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于无标注网络视频数据的多模态预训练方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务