买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:河南工业大学
摘要:本发明公开了一种基于三维张量结构信息的跨库语音情感识别方法,包括:(1)获取两个不同的语音情感数据库,选择包含若干语音样本和对应情感标签的数据库作为源域,选择仅包含若干语音样本的数据库作为目标域;(2)对源域和目标域的各语音样本进行预处理,提取其声学特征;(3)将步骤(2)源域和目标域提取的声学特征归一化后输入自编码网络去除特征中的冗余信息,得到低维编码特征,并将得到的编码特征扩展为三维张量形式的特征;(4)将三维张量特征通过张量奇异值分解得到核心张量和不同维度的因子矩阵;(5)利用多尺度径向基函数将不同维度的因子矩阵分别在三个维度进行对齐;(6)构建总体损失函数,通过调整损失参数,进行网络优化,确保模型在目标域上的识别精度和泛化能力。实验表明本发明取得了更好的识别性能。
主权项:1.一种基于三维张量结构信息的跨库语音情感识别方法,其特征在于该方法包括:1获取两个不同的语音情感数据库,选择包含若干语音样本和对应情感标签的数据库作为源域,选择仅包含若干语音样本的数据库作为目标域;2对源域和目标域的各语音样本进行预处理,选取INTERSPEECH2010情感挑战赛规定的声学特征作为模型输入进行特征提取;3将步骤2提取的声学特征输入自编码网络去除特征中的冗余信息,得到低维编码特征,然后,将低维编码特征通过增加一个额外维度扩展为三维张量形式,得到三维张量特征;4利用张量奇异值分解技术对所获得的三维张量特征进行分解,得到核心张量和不同维度的因子矩阵,采用低秩张量近似方法表示原始张量;5利用多尺度径向基损失函数将源域和目标域不同维度的因子矩阵分别对齐,调整尺度参数和损失参数;6构建总体损失函数,利用源域样本训练模型,采用Adam优化网络完成模型训练,并利用训练好的模型对目标域进行识别,输出情感类别。
全文数据:
权利要求:
百度查询: 河南工业大学 一种基于三维张量结构信息的跨库语音情感识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。