恭喜平安科技(深圳)有限公司郭洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜平安科技(深圳)有限公司申请的专利基于编码模型的语音转换方法、装置、电子设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115273804B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210908836.6,技术领域涉及:G10L13/02;该发明授权基于编码模型的语音转换方法、装置、电子设备及介质是由郭洋;王健宗设计研发完成,并于2022-07-29向国家知识产权局提交的专利申请。
本基于编码模型的语音转换方法、装置、电子设备及介质在说明书摘要公布了:本申请实施例提供了一种基于编码模型的语音转换方法、装置、电子设备及介质,属于语音转换技术领域。该方法包括:获取样本语音集合,样本语音集合包括源说话人语音和参考语音;基于编码模型对样本语音集合中的源说话人语音和参考语音进行语音合成,得到目标语音;根据目标语音对编码模型进行训练,确定与编码模型对应的损失函数;根据损失函数更新编码模型,得到目标编码模型;接收用户的语音请求,语音请求携带音色信息;将语音请求输入目标编码模型,根据音色信息将语音请求中的语音转换成对应的合成语音,本申请实施例能够增强编码模型对任意说话人的泛化性,提高语音转换的准确性以及真实性。
本发明授权基于编码模型的语音转换方法、装置、电子设备及介质在权利要求书中公布了:1.一种基于编码模型的语音转换方法,其特征在于,所述编码模型包括内容编码器和向量编码器;所述方法包括:获取样本语音集合,所述样本语音集合包括源说话人语音和参考语音;基于所述编码模型对所述样本语音集合中的所述源说话人语音和所述参考语音进行语音合成,得到目标语音;根据所述目标语音对所述编码模型进行训练,确定与所述编码模型对应的损失函数,其中,所述损失函数包括编码损失函数、生成损失函数和辨别损失函数;根据所述损失函数更新所述编码模型,得到目标编码模型;接收用户的语音请求,所述语音请求携带音色信息;将所述语音请求输入所述目标编码模型,根据所述音色信息将所述语音请求中的语音转换成对应的合成语音;其中,所述基于所述编码模型对所述样本语音集合中的所述源说话人语音和所述参考语音进行语音合成,得到目标语音,包括:将所述源说话人语音输入所述编码模型中的所述内容编码器进行映射,得到所述源说话人语音的语音内容;将所述参考语音输入所述编码模型中的所述向量编码器进行向量提取,得到所述参考语音的参考语音向量;将所述源说话人语音输入所述编码模型中的所述向量编码器进行向量提取,得到所述源说话人语音的源说话人向量;根据所述参考语音向量对所述源说话人语音中的所述源说话人向量进行替换,得到替换结果;将所述替换结果和所述语音内容输入所述编码模型中的生成器进行合成,生成所述目标语音;其中,所述根据所述目标语音对所述编码模型进行训练,确定与所述编码模型对应的损失函数,包括:根据所述目标语音对所述编码模型中的编码器和生成器进行训练,生成训练语音;根据所述编码模型中的辨别器对所述训练语音进行计算,得到辨别预测值;根据所述辨别预测值更新所述辨别器的辨别损失函数以及所述生成器的生成损失函数;根据所述语音内容更新所述内容编码器的所述编码损失函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。