买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:济南大学
摘要:本发明提供一种基于大模型的粗细粒度相结合的哈希视频检索方法,通过获取视频数据集数据;对视频数据集进行划分和预处理操作;将视频输入分别输入到CLIP帧特征提取模块和Transformer视频特征提取模块;将得到的帧特征信息通过提出的多粒度融合模块中的空间注意力机制进行加权得到帧融合视频信息;将得到的粗粒度视频信息与帧融合视频信息按照给定的特定超参数进行加权融合,最终得到视频信息;将得到的视频信息输入哈希码生成模块中,并通过损失函数,优化网络;将测试样本与数据库中的样本根据汉明距离进行排序,检索到的正确结果。通过采用本发明的技术方案,能够有效增加视频检索的速度,提高视频检索的精度。
主权项:1.一种基于大模型的粗细粒度相结合的哈希视频检索方法,其特征在于,包括步骤如下:步骤1,获取视频数据集数据;步骤2,对步骤1获得的视频数据集进行划分和预处理操作,得到视频输入数据;步骤3,将视频输入数据分别输入到CLIP帧特征提取模块和Transformer视频特征提取模块,分别得到细粒度的帧特征信息和粗粒度的视频特征信息;步骤4,将步骤3得到的帧特征信息通过多粒度融合模块中的空间注意力机制进行加权得到帧融合视频信息;步骤5,将步骤3得到的粗粒度的视频特征信息与步骤4得到的帧融合视频信息按照特定超参数进行加权融合,最终得到视频信息;步骤6,将步骤5得到的视频信息输入到哈希码生成模块中,并通过损失函数,优化所提出的网络;步骤7,将测试样本输入到训练好的基于大模型的粗细粒度相结合的哈希网络中,与数据库中的样本根据汉明距离进行排序;步骤8,选取排序靠前的结果进行输出,得到检索结果。
全文数据:
权利要求:
百度查询: 济南大学 一种基于大模型的粗细粒度相结合的哈希视频检索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。