首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

端到端的语音合成方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明公开了一种端到端的语音合成方法,该方法包括获取待转换文本以及音频数据,并将待转换文本和音频数据输入到语音合成模型中;语音合成模型包括情感打分器、文本编码器、随机时间预测器、单调对齐搜索和合成解码器;通过情感打分器对音频数据进行情感识别,得到情感强度;通过文本编码器对待转换文本和情感强度进行特征提取,得到文本特征;通过随机时间预测器对文本特征进行持续时间预测,得到音素持续时间分布;通过单调对齐搜索对音素持续时间分布和所述文本特征进行特征对齐,得到对齐特征;通过合成解码器对对齐特征进行语音合成,得到目标语音数据。本发明实现了在语音合成中增加情感强度的表达,使得语音合成的效果更佳。

主权项:1.一种端到端的语音合成方法,其特征在于,包括:获取待转换文本以及与所述待转换文本对应的音频数据,并将所述待转换文本和所述音频数据输入到语音合成模型中;所述语音合成模型包括情感打分器、文本编码器、随机时间预测器、单调对齐搜索和合成解码器;通过情感打分器对所述音频数据进行情感识别,得到与所述待转换文本对应的情感强度;通过文本编码器对所述待转换文本和所述情感强度进行特征提取,得到文本特征;通过随机时间预测器对所述文本特征进行持续时间预测,得到音素持续时间分布;通过单调对齐搜索对所述音素持续时间分布和所述文本特征进行特征对齐,得到对齐特征;通过合成解码器对所述对齐特征进行语音合成,得到与所述待转换文本对应的目标语音数据。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 端到端的语音合成方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术