首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法 

申请/专利权人:北京工业大学

申请日:2021-01-20

公开(公告)日:2024-06-25

公开(公告)号:CN112650877B

主分类号:G06F16/583

分类号:G06F16/583;G06F16/51;G06F16/22;G06N3/0464;G06N3/045;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2021.04.30#实质审查的生效;2021.04.13#公开

摘要:一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法属于计算机视觉和遥感图像检索领域。该方法对深度残差神经网络进行了改进,用于提取遥感图像的深度特征;然后采用了深度哈希算法DPSHDeepPairwise‑SupervisedHashing将提取的深度特征映射为二值哈希码,通过汉明距离度量两幅图像哈希码之间的相似性。该方法可以在获得高检索精度的同时,实现快速检索,对发挥遥感数据效应具有重要的意义,在资源勘探、海洋环境保护、自然灾害评估、军事、国防等各种领域均具有重要的应用价值。

主权项:1.一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法,其特征在于:步骤1:构建数据集使用的原始数据集为公共遥感图像数据集,对图像进行缩放或裁剪,归一化为224×224大小;步骤2.1:深度残差卷积神经网络结构的改进在现有的ResNeXt-50的最后一个池化层后面再连接了2个全连接层,以实现将ResNeXt-50原有的2048维深度特征降维至96维;第1个全连接层包含512个神经元,该全连接层后连接ReLU激活函数进行非线性变换,再添加一个dropout来避免过拟合,其中dropout参数采用默认值p=0.5;进行dropout处理后连接第2个全连接层,其包括有96个神经元,将特征维度降维至96维;步骤2.2:网络训练利用ImageNet数据集对ResNeXt-50进行预训练,得到初始的网络模型参数;接下来,将ImageNet预训练的网络模型迁移到遥感图像数据集上,即对ResNeXt-50后面连接的2个全连接层参数进行随机初始化;损失函数设为LikelihoodLoss+QuantizationLoss;其中LikelihoodLossJ1和QuantizationLossJ2分别表示为:J1=-s*Θ+Θ'+log1+e-||Θ||1J2=η||X-sgnX||22Loss=meanJ1+meanJ23其中:s=LYT为1×C的行矩阵,L=[0,xt,…,0]T为1×N维的行矩阵,该矩阵中仅有一个元素xt=1,0≤t≤N-1,其余组成元素均为0,表示训练集图片对应的类别标签,其中N为图像类别数; 为1×C维的行矩阵,C为训练集图像数目,X=[x1,x2,…,xM]T为最后一个全连接层的输出,M为特征维数;U为C×M维的矩阵,而U中每行数据利用索引对应的X进行更新,即最后一个全连接层输出的图像的低维深度特征;Θ'是将Θ中小于0的元素均置0后得到的矩阵;Y为C×N维的矩阵,Y中每行数据利用索引对应的L进行更新,η是用来正则化的超参数,设置为η=0.1;*表示哈达马乘积,mean·表示计算矩阵中所有元素平均值,sgn·为哈希函数;利用随机梯度下降算法对参数进行迭代训练40个epochs,得到优化后的网络模型;步骤2.3:低维深度特征的提取利用训练得到的改进ResNeXt-50作为骨干网络,将最后一个全连接层的输出提取出来,作为图像的低维深度特征;该特征用矢量X表示,X=[x1,x2,…,xM]T,M表示特征维数;M=96;步骤3:特征哈希库的生成与关联利用DPSH算法中的哈希函数对步骤2.3中生成的低维深度特征进行哈希映射,得到二值哈希码;哈希函数表示如下: 其中xi∈X,i=1,2…,M;经过映射,得到低维深度特征对应的二值哈希码,哈希码的维数与低维深度特征的维数相同;将每幅图像的物理地址、低维深度特征与二值哈希码一一对应,建立“图像物理地址—低维深度特征—二值哈希码”关联对,并将这些关联存储至数据库系统,构建哈希特征库,作为索引,用于检索;步骤4:遥感图像的快速检索;步骤4.1:对待检索的遥感图像大小进行归一化处理,处理后的图像大小为224×224;步骤4.2:将归一化的遥感图像输入到训练得到的网络模型中,提取图像的低维特征,再利用步骤3生成哈希码;步骤4.3:将哈希码与构建的特征哈希库的哈希码逐一进行相似性比较,比较时使用汉明距离来衡量两个哈希码之间的相似度,计算公式如下: 其中,X=x1,x2,…,xM和Y=y1,y2,…,yM分别表示两个哈希码,M为哈希编码长度为96,d为二者之间的汉明距离;d值越小,则表明两幅图像的相似度越高;对特征哈希库中的所有记录与待检索图像的哈希码逐一进行相似度比较,并按照d值由小至大进行排序,取出排序靠前的若干条记录中的低维特征;步骤4.4:将步骤4.3取出的低维深度特征与待检索图像的低维深度特征进行L2距离度量,并按照相似度大小进行重排序,按照重排序结果从数据库中提取出遥感图像返回给用户;n维空间中两个点x1x11,x12,…,x1n与x2x21,x22,…,x2n间的L2距离定义如下;

全文数据:

权利要求:

百度查询: 北京工业大学 一种基于改进的深度残差卷积神经网络和深度哈希的高清遥感图像快速检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。