一种融合强化学习与递进学习的表情识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：南京邮电大学

摘要：本发明公开了一种融合强化学习与递进学习的表情识别方法，该方法包含：构建包含样本筛选模块与表情分类模块的强化学习模型；将训练集样本划分为I组，使用一组样本对强化学习模型的每一轮训练中，表情分类模块输出预测类别概率，样本筛选模块将样本分为容易、较易、不易分类样本，按照递进学习思想使用容易、较易和不易分类样本对表情分类模块重新训练，根据重新训练前后表情分类模块输出的预测类别概率之差，基于强化学习方法调整样本筛选模块，进入下一轮的模型训练，经过I轮迭代训练得到训练好的表情分类模块；用训练好的表情分类模块对人脸图像进行表情识别。该方法能消除含噪声标签样本对模型训练的不利影响,提升表情识别准确性和鲁棒性。

主权项：1.一种融合强化学习与递进学习的表情识别方法，其特征在于，该方法包括以下步骤：S1：构建包含样本筛选模块与表情分类模块的强化学习模型；S2：将训练集样本划分为I组，在使用一组样本对强化学习模型的每一轮训练中，表情分类模块输出预测类别概率，样本筛选模块将样本分为容易、较易或不易分类样本，按照递进学习思想依次使用容易、较易和不易分类样本对表情分类模块重新训练，根据重新训练前后表情分类模块输出的预测类别概率之差，基于强化学习方法调整样本筛选模块，并进入下一轮的模型训练，经过I轮迭代训练得到训练好的表情分类模块；S3：用训练好的表情分类模块对人脸图像进行表情识别；所述步骤S2包含以下子步骤：步骤2.1：对样本筛选模块、表情分类模块进行随机初始化，利用人脸表情图像库中的所有训练样本对表情分类模块进行初步训练；步骤2.2：将人脸表情图像库中训练集样本划分为I组，每组K个样本，其中样本一共有C个类别；步骤2.3：分别初始化i和k的值为1，设第i组第k个样本为其标签类别为其中，i∈{1，2…I}，k∈{1，2…K}；判断i≤I是否成立，如果成立，则执行步骤2.4，如果不成立，则执行步骤S3；步骤2.4：判断k≤K是否成立，如果成立，则执行步骤2.5，如果不成立，则执行步骤2.8；步骤2.5：将样本输入表情分类模块进行特征提取得到特征向量并输出第c类类别预测概率为得到对应标签类别的预测概率将第i-1组已分类为容易、较易、不易分类样本中容易分类样本的类平均特征向量设为feasy、较易分类的类平均特征向量设为feasier、不易分类样本的类平均特征向量设为fhard；当i＝1时，feasy、feasier、fhard设为全零向量；当i≠1时，将第i-1组已分类为容易、较易、不易分类样本按类别输入表情分类模块进行特征提取，并将提取到的特征向量按照类别计算平均以得到类平均特征向量feasy、feasier、fhard；步骤2.6：获取样本的状态，步骤S2中有关强化学习模型中状态的定义如下：每个表情图像样本都有一个状态它包含当前样本的特征向量还包含feasy、feasier和fhard；则样本的状态为特征向量与各类的平均特征向量feasy、feasier、fhard拼接得到的向量，并将状态输入样本筛选模块；步骤2.7：对样本的状态进行动作选择，步骤S2中有关强化学习模型中动作的定义如下：样本筛选模块的动作是将样本分为容易分类样本、较易分类样本和不易分类样本，设a1表示将样本分为容易分类样本的动作，a2表示将样本分为较易分类样本的动作，a3表示将样本分为不易分类样本的动作，其中，样本筛选模块中Sigmoid分类层输出结果ρ，当ρ≤k1时执行动作a1，当k1＜ρ＜k2时执行动作a2，当k2≤ρ时执行动作a3，其中，ρ∈[0,1]，0＜k1＜k2＜1；则对于样本样本筛选模块执行的动作为样本筛选模块将样本分类为容易分类样本，较易分类样本或不易分类样本，并将样本放入相应样本子集，设样本数据集表示为D∈Rn，将D分为三个样本子集：容易分类样本集Deasy∈Rn，较易分类样本集Deasier∈Rn以及不易分类样本集Dhard∈Rn，其中，D＝Deasy∪Deasier∪Dhard，k++跳转到步骤2.4；步骤2.8：对于第i组中的K个样本的标签类别预测概率计算步骤2.9：采用递进学习的思想，按照先易后难的顺序，分三个阶段循序渐进地对表情分类模块进行重新训练，得到重新训练的表情分类模块；步骤2.10：对样本筛选模块进行奖励，步骤S2中有关强化学习模型中奖励的定义如下：在表情分类模块重新训练之后，将样本输入到表情分类模块，得到标签类别的预测概率令将作为奖励，奖励值越高，则表示样本筛选模块的筛选越正确；利用重新训练后的表情分类模块依次对第i组中的K个样本分别进行类别预测以得到对应标签类别的预测概率根据奖励的定义，计算奖励将一种使用奖励的交叉熵作为损失函数，训练样本筛选模块的参数θ，损失函数为其中，表示输入样本筛选模块时的输出；i++跳转到步骤2.3。

全文数据：

权利要求：

百度查询：南京邮电大学一种融合强化学习与递进学习的表情识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于地铁维护的数字镜像模拟系统及其模拟方法

下一篇：一种催化氧化陶粒及其制备方法和应用

相关技术

一种用于地铁维护的数字镜像模拟系统及其模拟方法

一种催化氧化陶粒及其制备方法和应用

一种用于调节阀的智能调节方法、设备及系统

一种基于磁控溅射法制备的Mxene复合Ni/Co纳米薄膜、制备方法及应用

福利额度管理方法、装置、设备、存储介质及计算机程序产品

音频参数优化方法及相关于音频参数的运算装置

一种汽车零部件生产表面检测装置

一种无掩膜的飞秒激光制造频率选择性吸波柔性薄膜材料的方法

一种水钻磨抛机的夹具移位装置

植物基馅料及其制备方法

一种催化反应滤膜及其制备方法和应用

具有红外吸收器的像素单元、像素阵列以及实现这种像素阵列的相机

学习相关技术

学习数据选择装置、学习数据选择方法及异常检测装置_三菱电机株式会社_202280093744.5

一种融合强化学习与递进学习的表情识别方法_南京邮电大学_202210767298.3

一种词组学习工具_董志斌_202420296391.5

基于深度学习的智能验布机_南通海隼数字科技有限公司_202420003602.1

学习能力评估方法及系统_浙江海亮科技有限公司_202411398137.7

拧紧类别的机器学习估计_阿特拉斯·科普柯工业技术公司_202410513962.0

用于训练机器学习模型的方法_罗伯特·博世有限公司_202410537639.7

用于CAD模型检索的机器学习_达索系统公司_202410500489.2

基于小样本不平衡学习的增强极限学习机故障诊断方法_广东石油化工学院_202311491198.3

一种基于深度学习的数据挖掘方法_成都锦城学院_202411135045.X

递进相关技术

一种级联递进式高精度无线时空频同步方法_中国电子科技集团公司第五十四研究所_202410918333.6

基于分级递进和集体知识的无人机目标检测蒸馏方法_河海大学_202410870827.1

一种双向递进注脂用自动润滑单元_湖南振雄科技有限公司_202410975655.4

基于递进式的多模态数据治理融合方法_中科世通亨奇(北京)科技有限公司_202410608133.0

一种递进式分级抽排油烟机_黄石市思创电器有限公司_202410832769.3

一种直线递进式多级杆离子聚焦传输设备及装置_江苏天瑞仪器股份有限公司_201910286063.0

一种递进式连接线加工送料装置_鸿东(巴东)电子实业有限公司_202420484070.8

一种基于分层推理和特征递进的图像智能识别方法_中国人民解放军92728部队_202410899055.4

一种递进式多无人机巡回桥梁表观病害快速检测方法_深圳大学_202410905577.0

一种多级循环递进式抽奖系统_宋林_202410791423.3

表情相关技术

一种基于域自适应的微表情识别方法_南京邮电大学_202210767992.5

表情识别模型及训练方法、识别方法、装置和计算设备_北京百度网讯科技有限公司_202011217953.5

一种可穿戴眼动和面部表情同步采集设备及方法_兰州大学_202110640110.4

一种融合强化学习与递进学习的表情识别方法_南京邮电大学_202210767298.3

表情人脸模型的处理方法、装置、设备、介质和程序产品_腾讯科技(上海)有限公司_202310506457.9

基于ControlNet的人脸表情生成方法_广西数科院科技有限公司_202410933470.7

一种基于轻量级EfficientVGG模型的表情识别方法_浙江工业大学_202410951175.4

一种面部表情识别及其模型训练方法_华中师范大学_202411015316.8

一种基于多元融合决策的人脸表情识别方法_南京师范大学_202111421431.1

一种所见即所得表情屏设计方法_浙江有鹿机器人科技有限公司_202410904366.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合强化学习与递进学习的表情识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务