Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜广州万企共赢科技管理有限公司周丽芳获国家专利权

恭喜广州万企共赢科技管理有限公司周丽芳获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜广州万企共赢科技管理有限公司申请的专利一种基于全局上下文结构差异的人脸伪造检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117037290B

龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310996708.6,技术领域涉及:G06V40/40;该发明授权一种基于全局上下文结构差异的人脸伪造检测方法是由周丽芳;阮杭生;李伟生;陈艺元;全好设计研发完成,并于2023-08-09向国家知识产权局提交的专利申请。

一种基于全局上下文结构差异的人脸伪造检测方法在说明书摘要公布了:本发明请求保护一种基于全局上下文结构差异的人脸伪造检测方法,属于计算机视觉技术领域。所述方法包括以下步骤:步骤1.提出了一种频域增强模块,该模块有助于提取到高压缩率下伪造伪影的频域特征。步骤2.设计了一个新的人脸重构‑分类无监督学习的网络结构,它可以通过人脸重构学习得到伪造人脸的伪造区域来指导分类学习分支,从而提高模型的泛化性。步骤3.提出了一种自预测卷积模块,旨在学习真实人脸的全局上下文结构,随后在验证阶段使用经过学习后的卷积块来预测输入人脸的全局上下文结构信息。步骤4.本发明在编码器阶段引入了对比学习损失函数促使真实人脸的特征在潜在空间相互拉近,伪造人脸的特征相互推远。

本发明授权一种基于全局上下文结构差异的人脸伪造检测方法在权利要求书中公布了:1.一种基于全局上下文结构差异的人脸伪造检测方法,其特征在于,包括以下步骤:步骤1、将人脸图像输入到频域增强模块中,先经过离散余弦变换DCT进行离线的频率域转换,随后经过可学习网络进行频率域的特征增强,得到一张经过增强后的频域人脸图像,从而最大化保留被压缩过的人脸图像中的伪造伪影;步骤2、将所述频域增强模块处理后的人脸图像以及原RGB图像输入到DGC-Net人脸重构-分类学习网络中,通过自预测卷积块,即通过自监督学习策略训练一个去掉中心的k×k卷积核,促使其学习真实人脸中全局上下文结构信息,得到相应的卷积参数,随后利用学习后的自预测卷积块来预测伪造人脸的伪造区域;步骤3、将得到的伪造区域与人脸图像做减法得到一张mask,随后与在人脸重构-分类学习网络中分类分支编码器得到的特征图相乘,再经过全连接层,从而判断该图像是否为伪造图像;所述步骤1将人脸图像输入到频域增强模块中,得到一张经过增强后的频域人脸图像,从而最大化保留被压缩过的人脸图像中的伪造伪影,具体包括以下步骤:A1、将训练图像输入到频域增强模块,首先将人脸图像分为8×8块,随后将每个块进行DCT和IDCT转换到频域空间中,具体转换过程如下: 其中,x表示转换之前图像的每个块,表示转换后图像的每个块;A2、将转换后图像块,馈送到块内增强模块,首先下采样将信号分为两部分,低频信号和高频信号k表示大小,为了增强相应频段的信号,将低频信号和高频信号分别馈送入两个多头自注意MHSA中,并将它们的输出串联以恢复原始形状;然后另一个MHSA协调所有不同的频带,新形成的信号表示MHSA用于捕获输入特征中每个频谱之间的相关性;A3、将块内增强后的结果,重新组合之后馈送到块间增强模块中,对于DCT,块之间是相互独立的,所述块内增强模块只增强了单个块的频域特征,为了帮助网络识别伪造伪影的位置,还在块之间建立连接;首先将重塑为然后,用MHSA来建模所有的块之间的关系;最后,上采样并得到增强的频率信号xfreq;所述频域增强模块采用离散余弦变换DCT进行离线的频率域转换,得到离线余弦变换后的频域图像,具体包括以下步骤:B1、输入图像首先被划分为8×8的patch,得到表示某一通道的patch,每个patch经离散余弦变换DCT处理成频谱其中每个值对应某一频带的强度,其中离散余弦变换过程公式化如下: 式2中Xi,j是图像坐标i,j上的值,cu和cv的目的是使DCT矩阵正交,N是每个块的大小,u,v=0,1,2…N-1;式3是变换u,v的一个基函数;B2、通过对频谱进行平坦化和整形,将相同频率的所有分量归入一个通道,形成新的输入;其过程如下公式所示: 其中公式4的代表每个patch的频域特征图,flatten·表示打平操作,代表将所有的di,j打平后的结果;所述步骤2具体包括以下步骤:C1、将输入人脸图像输入到人脸重构-分类学习网络,人脸重构-分类学习网络以Xception结构作为基础网络结构,对输入图像编码提取特征,获取各层特征F1,F2,F3,F4,然后通过解码器的上采样和卷积操作逐步恢复特征映射图到原始输入图像的大小,从而实现端到端的人脸图像的重构学习分支,将重构后的图像与输入图像引入了重构损失,其公式如下: 其中R为小批量样本集,|R|为R的基数,是重建后的图像,xi是原始输入图像;C2、将最后一层特征F4,通过通道均值μ·和方差σ·,在计算对比损失之前,需要一个非线性投影头gf·;因此,在编码器和投影头之后,得到了图像的嵌入特征,通过最小化对比损失,通过强迫来自正样本的表征相似而来自负样本的表征不同来学习,其公式为: 其中,τ是超参数,Λ-是批处理中其余的集合,且分别表示正样本对的特征表示;C3、在训练阶段,自预测卷积块学习真实人脸最后一层特征F4全局上下文结构信息,使得在验证阶段可以将学习后的自预测卷积块作用于伪造人脸特征上,预测出伪造人脸上下文结构的不一致信息;所述步骤C3具体包括:D1、屏蔽卷积层的可学习参数位于感受野的角落,由子核表示,其中是定义子核大小的超参数,c是输入通道的数量;每个核Ki位于距离感受野中心的掩蔽区域的距离处,其由表示,因此,感受野的空间大小k计算如下:k=2k′+2d+1;7将子核应用于所述真实人脸最后一层特征F4上,学习真实人脸的全局上下文结构信息;D2、掩蔽卷积的输出由信道注意模块处理,该信道注意模块计算每个信道的注意分数;通过这种机制,学习使用全局信息来根据需要选择性地强调或抑制重建图,并在块的输入和输出之间实现非线性处理;信道注意模块通过在每个信道上执行的全局池化将特征映射Z减少到向量随后,如下计算比例因子的向量其计算公式如下:s=σW2·δW1·z8其中σ是sigmoid激活,δ是ReLU激活,和分别表示两个连续的全连接层的权重矩阵;第一个全连接层由神经元组成,通过r的减少比率压缩信息;D3、引入了一个自监督重建损失,其计算公式如下: 其中G·表示对掩盖区域的重建过程,表示重建后的结果,m表示Ground-Truth的值;所述步骤D1训练自预测卷积模块,将子核应用于所述真实人脸最后一层特征F4上,学习真实人脸的全局上下文结构信息,具体包括:E1、训练阶段,是掩蔽卷积层的真实人脸输入张量,其中c是通道的数量,h和w分别是高度和宽度;在输入X的某个位置中利用定制内核执行的卷积运算仅考虑来自子内核Ki所处的位置的输入值,忽略其他信息;每个Ki与对应输入之间的卷积运算的结果被求和为单个数字;所得值表示位于与M相同位置处的预测;应用具有一个滤波器的卷积产生单个激活图;因此,仅能够在当前位置处从掩码向量M预测一个值;为了预测M中每个通道的值,引入了c个掩蔽卷积滤波器,每个滤波器预测来自不同通道的掩蔽信息;在输入周围添加k+d个像素的零填充,并将步幅设置为1,这样输入中的每个像素都用作掩码信息;输出张量Z的空间维度与输入张量X的空间维度相同;E2、验证阶段,是掩蔽卷积层的真实人脸或伪造人脸的输入张量,将训练阶段学习后的卷积滤波器应用于张量X上,真实人脸会得到正确的预测,伪造人脸的部分区域会得到错误的预测。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州万企共赢科技管理有限公司,其通讯地址为:510000 广东省广州市白云区白云大道北888号B1105房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。