买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:新疆大学
摘要:本发明公开了一种基于频域解耦和视觉Mamba的深度哈希图像检索方法,主要涉及深度哈希图像检索领域;包括步骤:S1、将图像数据集及其所对应的类别标签信息分成训练集、测试集和检索集;S2、构建基于频域解耦和视觉Mamba的深度哈希图像检索架构;S3、训练模型;S4、将测试集和检索集图片输入模型;S5、计算哈希码与检索集哈希码之间的汉明距离;S6、将汉明距离向量中的数值排序;S7、重复S5与S6操作,得到测试集中每张图像的检索结果,计算平均检索精度评估模型性能;本发明实现了对特征的频域解耦,并自适应的增强不同层级特征信息所匮乏的频域分量,充分挖掘图像的底层语义信息,生成更加紧凑和强区分度的哈希码。
主权项:1.一种基于频域解耦和视觉Mamba的深度哈希图像检索方法,其特征在于,包括步骤:S1、将图像数据集及其所对应的类别标签信息分别对应分成三部分:训练集、测试集和检索集,其中每个样本均包括一张图像及对应的类别标签,训练集和测试集中每个类别取相同的样本数,其他图片作为检索集;S2、构建基于频域解耦和视觉Mamba的深度哈希图像检索架构,它包括SwinTransformer特征提取骨干、层进式特征融合网络、哈希层、类代理哈希层和损失函数;其中SwinTransformer特征提取骨干和层进式特征融合网络用于学习图像特征,哈希层用于学习哈希函数的构建并得到输入图像的哈希码,类代理哈希层用于获取图像各个类别的类代理哈希码,损失函数用来引导哈希函数的优化方向;其中,层进式特征融合网络由自适应频域解耦增强模块、混合状态空间模块和特征融合操作组成;哈希层包括全连接层、层归一化层和激活函数tanh·;类代理哈希层包括全连接层和激活函数tanh·;损失函数包括全局相似性代理损失函数和量化损失函数;S3、利用训练集,依据基于频域解耦和视觉Mamba的深度哈希图像检索架构,通过训练得到基于频域解耦和视觉Mamba的深度哈希图像检索模型;S4、将测试集和检索集图片输入经过训练的基于频域解耦和视觉Mamba的深度哈希图像检索模型,分别得到测试集和检索集的哈希码;S5、取一个测试图像的哈希码,计算该哈希码与检索集哈希码之间的汉明距离,得到汉明距离向量;S6、将汉明距离向量中的数值按从小到大的顺序进行排序,按顺序输出对应的原始图像,得到该测试图像的检索结果;S7、重复S5与S6操作,得到测试集中每张图像的检索结果,计算平均检索精度评估模型性能。
全文数据:
权利要求:
百度查询: 新疆大学 一种基于频域解耦和视觉Mamba的深度哈希图像检索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。