首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

情绪识别方法、装置、计算机设备及存储介质 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-12-18

公开(公告)日:2024-07-02

公开(公告)号:CN112669876B

主分类号:G10L25/30

分类号:G10L25/30;G10L25/63

优先权:

专利状态码:有效-授权

法律状态:2024.07.02#授权;2022.01.14#实质审查的生效;2021.04.16#公开

摘要:本申请实施例属于人工智能领域,涉及一种情绪识别方法、装置、计算机设备及存储介质,其中方法包括:通过获取待识别文件,所述待识别文件为视频片段和或音频片段;将所述待识别文件输入到预设的特征提取模型进行特征提取,获得所述待识别文件的特征;将所述特征输入到同时经情绪识别训练和身份识别训练的情绪身份识别模型中进行情绪预测,获取所述情绪身份识别模型输出的情绪预测结果;根据所述情绪预测结果,确定所述待识别文件的情绪类别。通过身份识别和情绪识别综合训练,学习不同对象不同情绪的特征,提高了情绪识别的准确率。

主权项:1.一种情绪识别方法,其特征在于,包括下述步骤:获取待识别文件,所述待识别文件为视频片段和音频片段;将所述待识别文件输入到预设的特征提取模型进行特征提取,获得所述待识别文件的特征;将所述特征输入到同时经情绪识别训练和身份识别训练的情绪身份识别模型中进行情绪预测,获取所述情绪身份识别模型输出的情绪预测结果;根据所述情绪预测结果,确定所述待识别文件的情绪类别;当所述待识别文件为视频片段和音频片段时,所述视频片段和所述音频片段同步,所述将所述待识别文件输入到预设的特征提取模型进行特征提取,获得所述待识别文件的特征的步骤具体包括:将所述视频片段输入到预先训练的图像特征提取模型,获得所述视频片段的图像特征;将所述音频片段输入到预设的音频特征提取模型,获得所述音频片段的音频特征;所述情绪身份识别模型包含第二LSTM网络、第二情绪身份特征提取网络、第三LSTM网络和情绪预测结果输出层,将所述特征输入到同时经情绪识别训练和身份识别训练的情绪身份识别模型中进行情绪预测,获取所述情绪身份识别模型输出的情绪预测结果的步骤具体包括:将所述图像特征输入到所述第二LSTM网络,获取所述视频特征的时序图像特征;将所述音频特征输入到所述第二情绪身份特征提取网络,获取所述音频特征的情绪身份特征;将所述时序图像特征和所述情绪身份特征输入到预先训练的第三LSTM网络,获取待识别文件的音像特征;将所述音像特征输入到所述情绪预测结果输出层,获取所述情绪预测结果输出层输出的情绪预测识别结果;所述情绪身份识别模型还包括身份预测结果输出层,所述情绪身份识别模型的训练包括下述步骤:获取训练样本,所述训练样本为标注有情绪类别和身份的N个文件,N为大于0的正整数,所述文件包含同步的视频片段和音频片段;将所述训练样本中的视频片段输入到预先训练的图像特征提取模型,获得所述训练样本的N个图像特征;将所述训练样本中的音频片段输入到预设的音频特征提取模型,获得所述训练样本的N个音频特征;将所述N个图像特征和所述N个音频特征输入到所述情绪身份识别模型中,得到所述情绪预测结果输出层输出的N个情绪预测结果和所述身份预测结果输出层输出的N个身份预测结果;通过第三损失函数比对所述N个情绪预测结果和所述N个身份预测结果与所述标注的情绪类别和身份识别是否一致,其中所述第三损失函数为:L3=L2_vEmotion+L2_vFace+L2_aEmotion+L2_aFace+L_ids+λL_Emotion其中,L2_vFace和L2_vEmotion为所述第二LSTM网络的损失函数,L2_aEmotion和L2_aFace为所述第二情绪身份特征提取网络的损失函数,L_ids为所述身份预测结果的损失函数,L_Emotion为所述情绪预测结果的损失函数,λ为大于1的可调系数,所述情绪预测结果的重要程度大于所述身份预测结果,所述vFace为所述待识别文件为视频片段时的身份预测函数名称,所述vEmotion为所述待识别文件为视频片段时的情绪预测函数名称,所述aFave为所述待识别文件为音频片段时的身份预测函数名称,所述aEmotion为所述待识别文件为音频片段时的情绪预测函数名称,所述Emotion为待识别的文件为视频片段和音频片段时的情绪预测函数名称,所述ids为待识别的文件为视频片段和音频片段时的身份预测函数名称,所述L2_vEmotion、L2_aEmotion、L_Emotion采用arcfaceloss损失函数,所述L2_vFace、L2_aFace、L_ids采用softmaxloss损失函数;调整所述情绪身份识别模型中各节点的参数,至所述第三损失函数达到最小值时结束,得到同时经情绪识别训练和身份识别训练的情绪身份识别模型。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 情绪识别方法、装置、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。