首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于交叉卷积神经网络的本质图像分解方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西安建筑科技大学

摘要:本发明公开了一种基于交叉卷积神经网络的本质图像分解方法及系统,所述方法包括以下步骤:将待分解的原始图像输入训练好的GoogLeNet‑VGG19交叉卷积神经网络模型中,获得原始图像分解得到的光照图和反射图;其中,所述GoogLeNet‑VGG19交叉卷积神经网络模型由光照图生成网络与反射图生成网络进行交叉融合构成;所述光照图生成网络基于GoogLeNet卷积神经网络构造,所述反射图生成网络基于VGG19卷积神经网络构造;采用Adam优化方法对光照图生成网络与反射图生成网络进行训练。本发明中,本质图像分解的结果图像在相同物体的反射率上保持一致,在对边缘信息的保护和对噪声的去除方面表现较好,图像质量较高,无论是细节还是清晰度方面都与真值图像更为接近。

主权项:1.一种基于交叉卷积神经网络的本质图像分解方法,其特征在于,包括以下步骤:将待分解的原始图像输入训练好的GoogLeNet-VGG19交叉卷积神经网络模型中,获得原始图像分解得到的光照图和反射图;其中,所述GoogLeNet-VGG19交叉卷积神经网络模型由光照图生成网络与反射图生成网络进行交叉融合构成;所述光照图生成网络基于GoogLeNet卷积神经网络构造,所述反射图生成网络基于VGG19卷积神经网络构造;所述训练好的GoogLeNet-VGG19交叉卷积神经网络模型的获取步骤包括,采用Adam优化方法对光照图生成网络与反射图生成网络进行训练;其中,光照图生成网络基于GoogLeNet卷积神经网络构造的步骤具体包括:在GoogLeNet卷积神经网络inception3a第二层4个卷积操作后分别添加1个ReLU激活函数,4个ReLU激活函数共同输出到inception3a的DepthConcat层;在GoogLeNet卷积神经网络inception3b第二层4个卷积操作后分别添加1个ReLU激活函数,4个ReLU激活函数共同输出到inception3b的DepthConcat层;在GoogLeNet卷积神经网络inception4a中,第一层2个卷积操作和第二层2个卷积操作相连,形成2个连接通道;在2个连接通道上分别添加1个ReLU激活函数与MaxPool操作组合,ReLU激活函数在前,MaxPool操作在后;在GoogLeNet卷积神经网络inception4b中,第一层2个卷积操作和第二层2个卷积操作相连,形成2个连接通道;在2个连接通道上分别添加1个ReLU激活函数与MaxPool操作组合,ReLU激活函数在前,MaxPool操作在后;将GoogLeNet卷积神经网络inception4b的DepthConcat层输出跳跃连接到inception4d的DepthConcat层;将GoogLeNet卷积神经网络inception4e第一层的AveragePool操作后面的卷积操作输出直接连接到inception4e的DepthConcat层;将GoogLeNet卷积神经网络inception4e的DepthConcat层输出跳跃连接到inception5b的DepthConcat层;在GoogLeNet卷积神经网络inception5a第三层4个卷积操作后分别添加1个ReLU激活函数,4个ReLU激活函数共同输出到inception5a的DepthConcat层;在GoogLeNet卷积神经网络inception5b第二层4个卷积操作后分别添加1个ReLU激活函数,4个ReLU激活函数共同输出到inception3b的DepthConcat层;在GoogLeNet卷积神经网络的FC层后增加一个FC层;反射图生成网络基于VGG19卷积神经网络构造的步骤具体包括:将VGG19卷积神经网络第一个MaxPool输出结果与第二个MaxPool输出结果进行Concat操作,得到的结果输入到VGG19卷积神经网络第五层;将VGG19卷积神经网络第三个MaxPool输出结果与第四个MaxPool输出结果进行Concat操作,得到的结果输入到VGG19卷积神经网络第十三层;删除VGG19卷积神经网络第十七层和第十八层;在VGG19卷积神经网络第十六层后增加两个结构与第十六层完全相同的层,构成修改后的VGG19卷积神经网络第十七层和第十八层;光照图生成网络与反射图生成网络进行交叉融合的步骤具体包括:将GoogLeNet卷积神经网络inception4e的DepthConcat层输出连接到VGG19卷积神经网络的第十三层;将VGG19卷积神经网络的第四个MaxPool输出连接到GoogLeNet卷积神经网络inception5a的第二层的卷积操作;光照图生成网络的损失函数Loss1的表达式为: 式中,X为输入图像,为预测图像,H,W,C分别为输入图像的高、宽和通道数,x,y表示图像的像素点坐标,c表示通道,μi表示第i个尺度下的权重,Xi表示第i个尺度下的图像,表示改进GoogLeNet卷积神经网络生成的第i个尺度下的预测图像;反射图生成网络的损失函数Loss2的表达式为: 式中,Y表示输入图像,表示输入图像经过改进VGG19网络处理后的估计值,Cj,Hj,Wj分别表示第j层输出特征图的通道数、高度和宽度,Vj.表示第j层网络处理图像时激活函数的输出,j表示层数;采用Adam优化方法对光照图生成网络与反射图生成网络进行训练的步骤具体包括:以预构建的训练图像样本库中的图像作为样本,采用Adam优化方法同时对光照图生成网络和反射图生成网络进行训练;在训练过程中,将光照图生成网络输出的光照图输入识别网络,识别网络输出光照图与训练样本标签图像一致的概率,对光照图生成网络的网络参数进行反向更新;将反射图生成网络输出的反射图输入识别网络,识别网络输出反射图与训练样本标签图像一致的概率,对反射图生成网络的网络参数进行反向更新;当损失函数Loss1达到最小时,停止对光照图生成网络的训练,得到最终的光照图生成网络;当损失函数Loss2达到最小时,停止对反射图生成网络的训练,得到最终的反射图生成网络;所述识别网络为多层卷积神经网络,包含相同的六层;每一层都依次为卷积操作、Sigmoid激活函数和MaxPool。

全文数据:

权利要求:

百度查询: 西安建筑科技大学 一种基于交叉卷积神经网络的本质图像分解方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。