恭喜河南工业大学庄志豪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜河南工业大学申请的专利一种基于迁移学习和多损失动态调整的跨库语音情感识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113851148B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111117676.5,技术领域涉及:G10L25/63;该发明授权一种基于迁移学习和多损失动态调整的跨库语音情感识别方法是由庄志豪;刘曼;汪洋;陶华伟;傅洪亮设计研发完成,并于2021-09-23向国家知识产权局提交的专利申请。
本一种基于迁移学习和多损失动态调整的跨库语音情感识别方法在说明书摘要公布了:本发明公开了一种基于迁移学习和多损失动态调整的跨库语音情感识别方法,本发明包括以下步骤:首先,搭建基于深度去噪自编码和深度神经网络的深度网络模型,用于压缩特征冗余信息和提高特征表征能力;然后,采用全局域及子域自适应方法实现特征迁移,同时减小样本不平衡问题对模型识别性能的影响;最后在训练阶段,构建动态权重因子来调整不同损失函数的贡献度,实现模型的优化。本发明提出的方法可以有效学习样本不平衡语料库的共性情感信息,减小特征分布差异。
本发明授权一种基于迁移学习和多损失动态调整的跨库语音情感识别方法在权利要求书中公布了:1.一种基于迁移学习和多损失动态调整的跨库语音情感识别方法,其特征在于,包括以下步骤:1准备语料库:获取样本不平衡的语料库,分别作为源域数据库和目标域数据库,其中,源域数据库包括有若干语音信号和对应的情感类别标签,目标域数据库包括有若干语音信号;2语音预处理:将源域数据库和目标域数据库中的语音信号进行预处理,为下一步提取特征做准备;3语音特征提取:对步骤2预处理完毕后的语音信号,提取语音情感特征,该特征包括但不限于MFCC、短时平均过零率、基频、均值、标准差、最大值、最小值;4特征处理:首先,通过步骤3得到源域特征源域特征对应的标签和目标域特征随后在Xs和XT中加入服从正太分布的噪音之后输入深度自编码器进行特征重构处理: 其中和为经过深度自编码器解码重构之后的样本特征;然后,将深度自编码器的编码输出输入深度神经网络作进一步处理,从而分别得到源域和目标域的低维情感特征和最后使用源域的真实标签Ys与经过softmax分类器预测的源域特征概率作交叉熵运算: 5特征迁移:首先,采用最大均值差异MMD算法来减小X′S和X′T的全局域特征分布距离: 其中Η为再生核希尔伯特空间RKHS,δ·为特征映射函数,即高斯核函数;然后,采用局部最大均值差异LMMD同时来减小X′S和X′T的全局域特征分布距离: 其中为源域样本中每个样本属于情感类别C的权重,为目标域样本中每个样本属于情感类别C的权重;6模型训练:根据上述步骤4和5得到的五个损失函数,再利用动态权重因子wi来调整不同损失函数对模型优化的贡献,进而得到模型整体的优化目标为:minLsum=∑iwiLi,wi>06动态权重因子表示为: 其中i∈{S,T,y,MMD,LMMD},αi>0;7重复步骤4、5,通过梯度下降法迭代训练网络模型,不断更新步骤6的动态权重因子,直至模型最优;8利用步骤7训练好的网络模型,使用sofmatx分类器预测步骤3中的目标域特征标签,最终实现语音情感在跨语料库条件下的情感识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人河南工业大学,其通讯地址为:450001 河南省郑州市高新技术产业开发区莲花街100号河南工业大学科技处;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。