首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Intral-Class Gap GAN的面部表情识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:沈阳理工大学

摘要:一种基于Intral‑ClassGapGAN的面部表情识别方法,所述的识别模型构建,包括以下几个步骤:(1)、采集人脸不同来源及不同表情的实时图像;(2)、将该图像输入至Intral‑ClassGapGAN神经网络模型进行识别;(3)、输出识别结果;本发明提供的基于生成对抗的面部表情识别方法,通过与传统人工提取表情特征的方法相比,实现了自动对人脸表情特征的提取,相比于稍微早期的神经网络面部表情识别,本发明实现了识别率的提高,从而精确的进行表情识别。

主权项:1.一种基于Intral-ClassGapGAN的面部表情识别方法,其特征在于:所述的识别模型构建,包括以下几个步骤:1、采集人脸不同来源及不同表情的实时图像;2、将该图像输入至Intral-ClassGapGAN神经网络模型进行识别;3、输出识别结果;所述2步骤中的Intral-ClassGapGAN神经网络模型构建方法如下:2.1、采集人脸不同来源及不同表情的历史图像;2.2、对采集的人脸图像进行预处理,构建人脸表情数据集;2.3、针对2.2步骤中的数据集中具有类内差距的面部表情识别问题,构建Intral-ClassGapGAN神经网络模型;2.4、结合输入图像与重构图像之间的像素差异和潜在向量的差异对网络的生成器和鉴别器进行同时训练,确保重构图像与输入图像的差异最小;具体如下:S14:基于步骤S13中处理的图像对基于生成对抗的IC-GAN神经网络的面部表情识别网络模型进行训练;包括以下步骤:S141:利用pytorch深度学习框架构建所提出的IC-GANIntral-ClassGapGAN神经网络,首先将S13步骤处理之后的图片输入到第一层卷积层进行卷积操作,通过4*4的卷积核对输入图像进行卷积,输出为128*128*64;再采用LeakyReLu激活函数对卷积进行非线性操作,输出为128*128*64;所述LeakyReLu激活函数为: ai是1,+∞区间内的固定参数;S142:对上一层的输出继续使用4*4的卷积核进行卷积操作,输出为64*64*128,继而采用batchnorm层对上一层的输出进行归一化操作,再采用LeakyReLu激活函数对卷积进行非线性操作,输出为64*64*128;S143:对上一层的输出继续使用步骤S142的方法进行卷积、batchnorm和LeakyReLu操作,输出为4*4*100;S144:对S143的输出进行卷积核4*4的反转置卷积操作,输出为29*29*1,然后使用batchnorm进行批量归一化操作,再采用ReLu激活函数对输出进行非线性操作,输出为32*32*128;所述ReLu激活函数为: S145:对上一层的输出再次进行步骤S144所述的卷积、bathnorm和ReLu操作,输出为64*64*64;S146:对上一层的输出使用ReLu激活函数进行非线性操作,再使用卷积核为4*4的反转置卷积对上一层进行卷积操作,然后使用Tanh激活函数进行非线性操作,输出为128*128*128;所述的Tanh激活函数为: S147:对上一层的输出再次进行S141-S143过程中的操作,输出为1*1*5;S148:将步骤S13中尺度归一化后的图像和S147的输出一起输入到一个4*4的卷积层,进行卷积操作,然后使用非线性激活函数LeakyReLu进行非线性激活,输出为128*128*64;S149:对上一层的输出使用4*4的卷积核对上一层的输出进行卷积操作,然后使用batchnorm进行批量归一化操作,再采用LeakyReLu非线性激活;S1491:继续对上一层的输出采用S142的过程进行卷积、batchnorm以及非线性操作输出为4*4*1;S1492:最后对上一层的输出采用Softmax,输出判别为真的概率;S1493:将S147过程的的输出进行全连接操作,通过Softmax分类器最终实现训练出5种表情,所述5种表情为1=happy,2=abomination,3=neutral,4=anxious,5=surpriseandfear,实现对面部表情的识别;S15:对图像进行数据增强以及数据扩充处理;包含:S151:将网络损失loss函数也分为四部分,对于第一部分的生成网络,在像素层面上减小原始图像和重构图像的差距,重构误差损失为:Lcon=Ex~pX||x-Gx||1;pX表示数据分配;X是输入图像Gx是网络中生成器生成的图像;使用Salimans等提出的特征匹配方法,以减少训练的不稳定性,图像特征层面进行优化,第二部分网络的鉴别器的一个特征匹配误差为:Ladv=Ex~pX||fx-fGx||2式中f·代表鉴别器模型变换;第三部分为潜在向量z与重构潜在向量的面部表情信息的编码损失,防止网络解码过程中与图片无关性信息的干扰: 式中h■代表编码变换;第四部分的网络损失为Softmax层的交叉熵损失: 式中k■代表Softmax的交叉熵损失过程,ky代表真实结果,代表识别结果;整体网络损失函数如下:L=ωadvLadv+ωconLcon+ωpLp+ωsLs其中ωadv,ωcon,ωp,ωs是调节损失的参数;S152:优化器选择AdamOptimizer,学习率设置为0.0002,训练样本分批次进行训练,每个批次选择16张图片进行训练,epoch分别设为100,200,300,400;S153:在每次的训练中首先获得1个epoch的图片,接下来计算loss损失值,然后使用Adam优化器不断更新网络的参数,使网络的损失值最小;S16:对所述网络模型进行训练并保存训练后的网络模型。

全文数据:

权利要求:

百度查询: 沈阳理工大学 一种基于Intral-Class Gap GAN的面部表情识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。