首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于帧级别情感状态对齐的语音情感识别方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京邮电大学

摘要:本发明提供一种基于帧级别情感状态对齐的语音情感识别方法和系统,所述方法包括:利用预训练的语音情感识别模型对输入的语音数据进行语音情感识别,得到句子级别语音情感识别结果。其中,在所述语音情感识别模型的预训练过程中,对于训练集包含的语音数据提取帧级别深层情感表征,利用预训练的聚类模型基于帧级别深层情感表征推理得到帧级别情感伪标签,使用包含语音数据和其帧级别情感伪标签的训练集训练得到帧级别情感状态对齐模型,通过对所述帧级别情感状态对齐模型结合情感标签进行迁移学习训练得到所述语音情感识别模型。本发明能够解决语音样本中不一致帧的干扰,并避免成本昂贵的问题。

主权项:1.一种基于帧级别情感状态对齐的语音情感识别方法,其特征在于,该方法包括以下步骤:预训练得到语音情感识别模型的步骤,具体包括:对于训练集包含的语音数据提取帧级别深层情感表征;利用预训练的聚类模型基于帧级别深层情感表征推理得到帧级别情感伪标签;其中,所述帧级别情感伪标签是表示语音序列结构的伪标签;使用包含语音数据和其帧级别情感伪标签的训练集训练得到帧级别情感状态对齐模型;通过对所述帧级别情感状态对齐模型结合情感标签进行迁移学习训练得到所述语音情感识别模型,该步骤包括:在所述帧级别情感对齐模型上添加一层注意力机制层,所述注意力机制的类型包含自注意力机制、加性注意力机制和硬注意力机制中的任一种;使用包含语音数据和情感标签的训练集对添加了注意力机制层的帧级别情感对齐模型进行迁移学习训练,获得训练完成的语音情感识别模型;利用预训练的语音情感识别模型对输入的语音数据进行语音情感识别,得到句子级别语音情感识别结果;其中,在所述语音情感识别模型的预训练过程中,对于训练集包含的语音数据提取帧级别深层情感表征,利用预训练的聚类模型基于帧级别深层情感表征推理得到帧级别情感伪标签,使用包含语音数据和其帧级别情感伪标签的训练集训练得到帧级别情感状态对齐模型,通过对所述帧级别情感状态对齐模型结合情感标签进行迁移学习训练得到所述语音情感识别模型。

全文数据:

权利要求:

百度查询: 北京邮电大学 基于帧级别情感状态对齐的语音情感识别方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。