端到端歌声合成方法、计算机设备及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：清华大学深圳国际研究生院

摘要：本发明公开了一种端到端歌声合成方法、计算机设备及存储介质，所述合成方法包括如下步骤：S1、从给定乐谱中获取歌词文本，对应乐谱音高以及乐谱时长；并从歌词中提取相应的语义信息并且将其作为模型输入的一部分；S2、将歌词文本转换为对应的音素序列后，与乐谱音高序列以及乐谱时长序列一起输入预构建的歌声合成模型第一输入端；S3、将语义信息输入预构建的歌声合成模型的第二输入端；S4、通过歌声合成模型合成对应真人演唱的歌声。本发明能够提升合成歌声的自然度和表现力，并且可以应用于任意的歌声合成方案中。

主权项：1.一种端到端歌声合成方法，其特征在于，包括如下步骤：S1、从给定乐谱中获取歌词文本，对应乐谱音高以及乐谱时长；并从歌词中提取相应的语义信息并且将其作为模型输入的一部分；步骤S1中，采用语义特征提取模块从歌词中提取相应的语义信息，语义特征提取模块包含三个部分：预训练的语义表征模型、上采样模块以及文本编码器模块；所述语义特征提取模块接受一句歌词的字符序列作为输入，并且输出音素级别的语义特征序列；语义信息由所述预训练的语义表征模型提取，输入为字级别的歌词序列，输出为字级别的语义特征序列；所述上采样模块将字级别的语义特征序列扩增为音素级别；并经过所述文本编码器模块得到音素级别语义特征序列；所述上采样模块将字级别的语义特征序列扩增为音素级别包括如下步骤：通过字-音素转换模块将每个字转换为对应的音素，得到每个字所对应的音素数量；根据每个字的音素数量，通过复制的方法将每个字级别的特征扩增为音素级别的特征；其次再根据数据集所提供的音素序列，记录其中静音段SP和吸气AP标识的位置，并且在扩增后的音素序列对应位置添加全零向量；S2、将歌词文本转换为对应的音素序列后，与乐谱音高序列以及乐谱时长序列一起输入预构建的歌声合成模型第一输入端；S3、将语义信息输入预构建的歌声合成模型的第二输入端；S4、通过歌声合成模型合成对应真人演唱的歌声。

全文数据：

权利要求：

百度查询：清华大学深圳国际研究生院端到端歌声合成方法、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：碳化硅基集成多晶异质结的功率器件及其制备方法

下一篇：一种电致重构的滤波阵列

相关技术

碳化硅基集成多晶异质结的功率器件及其制备方法

一种电致重构的滤波阵列

一种仓储换气扇的更换机构

一种益生菌肠胃调节营养制剂及其制备方法

一种检测MMP12蛋白的试剂在制备评估受试者未来发生心肌梗死风险产品中的应用

一种封闭式双螺杆空压机

一种涤纶长丝生产自动缠绕打结装置

一种电源适配器的侧插弹片组装结构

一种组合物及其在红叶石楠增色中的应用

一种护发素灌装用瓶体定位装置

一种板式逆流相变储能换热器

I2C接口电路和电子芯片

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

端到端歌声合成方法、计算机设备及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务