买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于柯西去噪概率扩散模型的语音合成方法及装置,包括:1计算面向语音合成的柯西噪声表;2计算面向语音合成的柯西后验平方尺度表;3实现面向语音合成的柯西扩散过程;4构建去噪神经网络,计算面向语音合成的柯西去噪神经网络损失函数;5实现面向语音合成的柯西去噪扩散模型的采样过程。本发明将柯西噪声引入去噪概率扩散模型,实现扩散模型的训练和采样,最终完成语音合成。利用本发明,可以提高语音合成方法的鲁棒性,有效提升了合成语音的质量。
主权项:1.一种基于柯西去噪概率扩散模型的语音合成方法,其特征在于,包括以下步骤:1定义两个面向语音合成的高斯去噪概率扩散模型,包括每个高斯去噪概率扩散模型的噪声表、单步扩散操作和多步扩散操作;根据两个高斯去噪概率扩散模型的噪声表,利用比率分布,计算用于语音合成的柯西噪声表;2根据噪声表、单步扩散操作和多步扩散操作,计算每个高斯去噪概率扩散模型的后验平方尺度表;根据两个高斯去噪概率扩散模型的后验平方尺度表,利用比率分布,计算用于语音合成的柯西后验平方尺度表;3根据得到的柯西噪声表,定义柯西单步扩散操作;根据柯西噪声表和柯西单步扩散操作,定义柯西多步扩散操作;定义柯西去噪概率扩散模型,包含柯西前向扩散过程和柯西逆向采样过程,柯西前向扩散过程包括柯西单步扩散操作和柯西多步扩散操作,实现去噪神经网络的训练;柯西逆向采样过程包含若干个单步柯西逆向采样过程,实现语音合成;4构建去噪神经网络;构建柯西噪声预测损失函数和柯西后验平方尺度预测损失函数,进一步构建去噪神经网络的损失函数,并对去噪神经网络进行训练;训练过程具体为:基于定义的柯西去噪概率扩散模型和后验平方尺度表,得到所有扩散步数的真实柯西噪声和柯西后验平方尺度,去噪神经网络计算预测的柯西噪声和后验平方尺度,根据损失函数训练去噪神经网络;5以梅尔谱图作为条件输入项,利用训练好的去噪神经网络实现语音合成;具体为:针对所有扩散步数,去噪神经网络预测柯西噪声和后验平方尺度,对输入噪声信号进行单步柯西逆向采样过程;连续应用单步柯西逆向采样过程,实现语音合成;单步柯西逆向采样过程包括随机性采样过程和确定性采样过程。
全文数据:
权利要求:
百度查询: 浙江大学 一种基于柯西去噪概率扩散模型的语音合成方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。