买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州倒映有声科技有限公司
摘要:本发明涉及语音合成技术领域,尤其涉及情感迁移语音合成方法及系统。包括步骤:得到文本编码向量;得到情感风格向量;得到文本‑语音对齐序列;将发言人身份ID输入到语音帧解码器,处理文本‑语音对齐序列,解码得到梅尔声谱特征。本发明中提出的情感信息提取模块,可以将音频特征中的发言人信息与情感信息完全解耦,情感编码向量只包含音频中的情感信息,并且提升了编码向量同该向量代表情感信息的相似性;能够利用该情感编码向量与发言人信息自由组合,实现了从源发言人的音频数据中,将情感信息迁移到无情感的目标发言人的任务;通过为该情感编码向量赋予权重,能更容易控制情感的强弱。
主权项:1.情感迁移语音合成方法,其特征在于,包括以下步骤:S1.将带有音素级别的文本输入序列输入文本编码器,得到文本编码向量;S2.根据语音所需的情感类别得到相应的情感类别编号,输入情感提取模块,得到情感风格向量;S3.将所述文本编码向量和情感风格向量经过文本语音帧对其模块,得到文本-语音对齐序列;S4.将发言人身份ID输入到语音帧解码器,并通过语音帧解码器处理文本-语音对齐序列,解码得到梅尔声谱特征。
全文数据:
权利要求:
百度查询: 杭州倒映有声科技有限公司 情感迁移语音合成方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。