首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种融合文本语义特征的低资源情感语音合成装置及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州电子科技大学

摘要:本发明涉及一种融合文本语义特征的低资源情感语音合成装置及方法,包括变量提取模块,输入模块,语义提取模块,文本嵌入模块,融合模块,情感预测模块和合成模块,本发明旨在通过低资源条件下的模型构建实现具有情感色彩的语音合成,实现了在低资源下高质量的情感语音合成。

主权项:1.一种融合文本语义特征的低资源情感语音合成装置,其特征在于:包括:变量提取模块:用于从训练数据集中提取音频的音高、能量、时长、语谱图的真实值,用作在训练过程计算预测值与真实值之间的损失;输入模块:在训练模型的过程中用于将文本分别输入至语义提取模块、文本嵌入、合成模块、将提取出的音高、能量、时长、语谱图输入到合成模块,在采用训练的模型进行训练时,将文本分别输入至语义提取模块、文本嵌入模块;语义提取模块:用于从文本中提取出文本语义特征Cemotion;文本嵌入模块:用于将文本转成音素嵌入序列,并通过编码器获得文本编码特征Ctext;融合模块:用于将文本语义特征Cemotion和文本编码特征Ctext采用加法融合策略获取融合特征序列Cfusion;情感预测模块:通过融合特征序列Cfusion预测时长Pduration、音高Cpitch、能量Cenergy,并将预测出的Cpitch,Cenergy嵌入到Cfusion中得到Cfpe,并根据Pduration的值在每个音素上进行复制拼接得到Cfped;合成模块:用于将Cfped输入到解码器中合成语谱图,将语谱图输入到声码器中合成具有情感的音频。

全文数据:

权利要求:

百度查询: 杭州电子科技大学 一种融合文本语义特征的低资源情感语音合成装置及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。