Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜江南大学陈莹获国家专利权

恭喜江南大学陈莹获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜江南大学申请的专利一种基于深度辨识度迁移的跨模态检索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113536015B

龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110754834.1,技术领域涉及:G06F16/583;该发明授权一种基于深度辨识度迁移的跨模态检索方法是由陈莹;代瑾;化春键;李祥明;胡蒙;裴佩设计研发完成,并于2021-07-02向国家知识产权局提交的专利申请。

一种基于深度辨识度迁移的跨模态检索方法在说明书摘要公布了:本发明公开了一种基于深度辨识度迁移的跨模态检索方法,属于信息检索技术领域。所述方法在学习不同模态数据公共表示特征的过程中,通过最小化解码向量与文本原始特征间的重建损失增强文本公共表示特征的语义辨识度,同时通过权重共享层的模态不变损失和样本相关性损失将文本公共表示特征的语义高辨识度迁移到图片公共表示特征,从而为各模态数据习得高语义辨识度的公共表示特征,进而提升了检索性能。

本发明授权一种基于深度辨识度迁移的跨模态检索方法在权利要求书中公布了:1.一种基于深度辨识度迁移的跨模态检索方法,其特征在于,所述方法包括:步骤S1,构建深度辨识度迁移网络,所述深度辨识度迁移网络包括原始多模态特征提取模块、文本辨识度迁移模块以及文本辨识度增强模块,各模块依次连接;步骤S2,采用公共数据集训练所构建的深度辨识度迁移网络,所述公共数据集包含n个图片文本对;步骤S3,利用训练好的深度辨识度迁移网络获得待检索图片或文本的最优公共表示特征,并采用余弦距离度量待检索图片或文本的最优公共表示特征与数据库中各图片或文本的公共表示特征间的距离,得到相似度矩阵,根据相似度矩阵输出相应的跨模态检索结果;所述方法在训练所构建的深度辨识度迁移网络时,首先提取公共数据集中图片的原始特征和文本的原始特征,并根据图片的原始特征和文本的原始特征分别学习对应图片公共表示特征U=[u1,u2,…un]和文本公共表示特征V=[v1,v2,…vn];然后设定语义约束函数J3和重构损失函数J4对文本公共表示特征V的语义辨识度进行增强;设定模态不变损失函数J1和样本相关性损失函数J2将增强后的文本公共表示特征的语义高辨识度迁移到了图片公共表示特征,增强图片公共表示特征的语义辨识度,训练过程中最小化总目标函数J并采用Adam模型进行参数更新,不断迭代从而得到训练好的的深度辨识度迁移网络,所述总目标函数J由模态不变损失函数J1、样本相关性损失函数J2、语义约束函数J3和重构损失函数J4共同构成;其中ui表示图片i的公共表示特征向量,vj表示文本j的公共表示特征向量,i=1,2,……,n;j=1,2,……,n;所述原始多模态特征提取模块由两个对称特征提取部分构成,分别用于提取图片和文本的原始特征,得到图片原始特征矩阵Hα和文本原始特征矩阵Hβ;所述文本辨识度迁移模块由图片公共表示特征学习模块和文本公共表示特征学习模块组成;二者均由两个激活函数为ReLU的全连接层组成,且二者的最后一层全连接层共享权重,称为共享权重层;所述文本辨识度增强模块由文本公共表示特征的线性分类器与文本公共表示特征的解码模块组成;其中文本公共表示特征的线性分类器为一层全连接,文本公共表示特征的解码模块包含两层激活函数为ReLU的全连接;所述方法在得到图片原始特征矩阵Hα和文本原始特征矩阵Hβ后,还包括:在共享权重层定义模态不变损失函数J1和样本相关性损失函数J2; 其中,||·||F表示F范数; 其中,表示图片i的公共表示特征和文本j的公共表示特征之间的余弦相似度,ui表示图片i的公共表示特征向量,vj表示文本j的公共表示特征向量;表示图片i的公共表示特征和图片j的公共表示特征之间的余弦相似度,表示文本i的公共表示特征和文本j的公共表示特征之间的余弦相似度,1{·}为指示函数;将图片原始特征矩阵Hα和文本原始特征矩阵Hβ送入文本辨识度迁移模块获得对应的图片公共表示特征U和文本公共表示特征V;所述方法还包括:利用所述线性分类器预测公共子空间的文本公共表示特征的语义类别,并增加语义约束函数J3: 其中,PTV为文本模态样本生成的预测类别向量,Y为真实类别标签;文本公共表示特征的解码模块通过一个欠完备自编码器对文本公共表示特征V中的每一个文本公共表示特征vi进行解码,得到对应的文本解码特征进而得到文本解码特征矩阵定义重构损失函数J4,利用重构损失函数J4最小化文本解码特征向量与文本原始特征向量之间的距离: 设定深度辨识度迁移的跨模态检索方法的总目标函数为:J=λ1J1+λ2J2+λ3J3+λ4J4其中,λ1、λ2、λ3、λ4是平衡超参,分别表示模态不变损失、样本相关性损失、文本语义损失以及文本解码特征重构损失的重要程度;最小化网络总目标函数J并采用Adam模型进行参数更新,不断迭代从而得到训练好的的深度辨识度迁移网络;其中线性分类器的更新公式为P=VVT-1VTY。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江南大学,其通讯地址为:214000 江苏省无锡市滨湖区蠡湖大道1800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。