恭喜齐鲁工业大学(山东省科学院)郑超群获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜齐鲁工业大学(山东省科学院)申请的专利面向多个多媒体检索任务的结构化多模态检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115952309B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310001747.8,技术领域涉及:G06F16/483;该发明授权面向多个多媒体检索任务的结构化多模态检索方法及系统是由郑超群;李雅芳;鹿文鹏;张维玉;乔新晓设计研发完成,并于2023-01-03向国家知识产权局提交的专利申请。
本面向多个多媒体检索任务的结构化多模态检索方法及系统在说明书摘要公布了:本发明公开了面向多个多媒体检索任务的结构化多模态检索方法及系统,属于多媒体检索技术领域,本发明要解决的技术问题为如何支持多个多媒体检索任务,技术方案为:该方法具体如下:获取一个包括图像模态和文本模态的多模态检索数据集,并将多模态检索数据集划分为训练数据集、测试数据集和数据库数据集;将图像模态和文本模态的原始数据分别输入到深度特征提取模型中对原始数据进行特征提取,从而获取图像模态的深度特征和文本模态的深度特征;在训练数据集上构造面向多个多媒体检索任务的结构化多模态哈希方法的目标函数。该系统包括数据预处理模块、深度特征表示模块、目标函数构造模块、哈希函数学习模块及在线模态哈希检索模块。
本发明授权面向多个多媒体检索任务的结构化多模态检索方法及系统在权利要求书中公布了:1.一种面向多个多媒体检索任务的结构化多模态检索方法,其特征在于,该方法具体如下: 获取一个包括图像模态和文本模态的多模态检索数据集,并将多模态检索数据集划分为训练数据集、测试数据集和数据库数据集; 将图像模态和文本模态的原始数据分别输入到深度特征提取模型中对原始数据进行特征提取,从而获取图像模态的深度特征和文本模态的深度特征; 在训练数据集上构造面向多个多媒体检索任务的结构化多模态哈希方法的目标函数; 通过面向多个多媒体检索任务的结构化多模态哈希方法的目标函数获取用于跨模态检索的第v个模态的线性投影矩阵Rv和用于多模态检索的转换矩阵W; 在线查询时,利用面向多个多媒体检索任务的结构化多模态哈希方法的目标函数,根据第v个模态的线性投影矩阵Rv和用于多模态检索的转换矩阵W获取测试数据集和数据库数据集中样本的哈希码,并获取每个测试数据集的测试样本的哈希码与数据库数据集样本的哈希码之间的汉明距离,将数据库数据集样本按照对应的汉明距离升序排序得到检索结果; 其中,在训练数据集上构造面向多个多媒体检索任务的结构化多模态哈希方法的目标函数具体如下: 通过目标函数fspe保存每个模态的特有属性; 通过目标函数fcom保存多模态特征的互补性; 通过目标函数fsup加上标签指导,自动地将语义信息分配到共享的转换矩阵中,弥合不同模态之间的差异; 构造最终的目标函数,公式为: f=fspe+fcom+fsup; 其中,fspe将每个模态映射到一个单独的潜在空间来学习模态不变的特征,以更好地保存每个模态的特有属性;fcom设置权重,以充分利用多模态特征的互补性;fsup同时利用标签和成对相似度矩阵,生成更具判别性的哈希码,从而保持高维空间和汉明空间之间的语义相似性; 利用哈希函数生成的哈希码进行跨模态检索,对于要查询的样本,其哈希码的预测公式如下: 其中,表示Nq个查询样本的非线性嵌入;线性投影矩阵Rv在训练阶段获得,直接用于在线跨模态检索; 预测任意多模态查询样本的哈希码,用于复合多模态检索问题,公式如下: 其中,表示Nq个查询样本的协同多模态映射;线性投影矩阵W在训练阶段获得。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院),其通讯地址为:250353 山东省济南市长清区大学路3501号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。