买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于注意力机制的表情识别方法,首先数据集进行增广,接着利用注意力掩膜模块进行残差单元卷积,用池化操作进行下采样,减少特征图的空间维度,特征图尺寸达到网络中最小之后,再用双线性插值方法进行上采样。再将深度递减的注意力掩膜模块以残差结构嵌入骨干网络,通过恒等映射保证随着网络深度加深响应不会变弱。最后通过全局平均池化与全连接层进行表情分类,实现表情识别任务。此网络结构的特点是可以生成注意力图,达到抑制不重要特征与增强重要特征的作用。本发明在FER2013表情数据集上的表现达到了较高的水平。
主权项:1.基于注意力机制的表情识别方法,其特征在于,包括如下步骤:步骤1:对FER2013数据集进行数据增广,并进行尺度变换;步骤2:将步骤1得到的增广数据输入注意力残差网络进行特征提取,生成对应的注意力图并通过残差连接的方式与原特征图相乘,得到加权后的特征图;步骤3:将得到的特征图输入运用全局平均池化,并最终通过全连接层进行分类;所述步骤2包括如下子步骤:步骤2.1:将数据增广后的图片经过卷积核尺寸为7×7,步长为2的卷积层,与3×3的最大池化层;步骤2.2:将步骤2.1得到的特征图输入残差层进行进一步的特征提取与降维;步骤2.3:将步骤2.2输出的特征图输入残差注意力层,最终输出特征图Hx如下式所示:Hx=1+Mx*x其中Mx代表残差注意力层中注意力掩膜模块的输出;步骤2.4:重复步骤2.2至2.3的操作两次,即输入图像一共经过三个残差块与残差注意力层的级联结构;其中三个残差块分别对应ResNet34网络结构中前三个残差块;步骤2.5:将步骤2.4输出的特征图经过最后一个残差块,对应ResNet34网络结构中的最后一个残差块结构;所述步骤3中包括如下子步骤:步骤3.1:将特征图进行全局平均池化,输出一个值;步骤3.2:将特征表示输入随机失活层,随机失活层的策略是以概率0.5让一部分输入数据失效;步骤3.3:将特征送入全连接层,并用Softmax函数将输出概率归一化,得到最终分类结果。
全文数据:
权利要求:
百度查询: 东南大学 基于注意力机制的表情识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。