首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

实时语音转多说话人语音的变声方法、装置及相关组件 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:深圳牛学长科技有限公司

摘要:本发明实施例提供了一种实时语音转多说话人语音的变声方法、装置及相关组件。该变声方法通过对用户音频进行特征提取、特征替换、搜索组合、编码、嵌入操作以及解码处理得到音频波形数据,使用户实现实时语音转多说话人语音的变声功能。此外,用户还可以根据音频波形数据的变声结果调节特征索引程度参数,使变声结果与模板人物更相似,而且通过声码器生成音频波形数据,无机械声和噪声。

主权项:1.一种实时语音转多说话人语音的变声方法,其特征在于,包括:提取用户音频的第一内容特征和音高特征;获取特征索引程度参数,并使用Top1检索按照所述特征索引程度参数对所述第一内容特征进行替换,得到训练集特征;使用faiss库对所述训练集特征进行搜索和组合,得到第二内容特征;将所述第二内容特征和音高特征输入至文本编码器进行编码,得到语义表示向量;获取多个模板人物编号,将多个所述模板人物编号输入嵌入层,得到多个说话人嵌入向量;将所述语义表示向量和各说话人嵌入向量输入至流模型,得到隐变量;利用声码器将所述隐变量和各说话人嵌入向量进行解码,生成多个音频波形数据。

全文数据:

权利要求:

百度查询: 深圳牛学长科技有限公司 实时语音转多说话人语音的变声方法、装置及相关组件

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。