恭喜南京理工大学孙理获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜南京理工大学申请的专利基于语音雷达和深度学习的语音合成方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114648974B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011492591.0,技术领域涉及:G10L13/02;该发明授权基于语音雷达和深度学习的语音合成方法及系统是由孙理;韦益民;薛彪;洪弘;李彧晟;顾陈;朱晓华设计研发完成,并于2020-12-17向国家知识产权局提交的专利申请。
本基于语音雷达和深度学习的语音合成方法及系统在说明书摘要公布了:本发明公开了一种基于语音雷达和深度学习的语音合成方法及系统,方法包括:由雷达获得声带振动回波信号;将雷达回波信号经过模式分解获取基波,然后对基波进行中心削波作为语音激励源;由发音者发音时嘴唇区域视频通过深度学习方法训练共振峰估计模型;将测试者发音的视频作为输入,获得共振峰参数;最后基于雷达回波激励源模型和共振峰参数进行语音合成。本发明方法可以获得保留基频连续变化特性的语音激励源和更加准确的共振峰参数估计,通过语音合成器,可以获得自然度更高的合成语音。
本发明授权基于语音雷达和深度学习的语音合成方法及系统在权利要求书中公布了:1.一种基于语音雷达和深度学习的语音合成方法,其特征在于,所述方法包括以下步骤:步骤1,由雷达获得声带振动回波信号,依据该回波信号获取语音合成激励源;步骤2,从发音者发音时的视频中提取唇区视频和对应音频,选取从发声者张口到闭口的连续M帧视频图像作为一包输入,并提取对应音频的共振峰参数,将多个视频输入,对应共振峰参数作为标签,利用深度学习方法对嘴唇运动特征与共振峰映射关系进行训练,获得共振峰参数估计模型;步骤3,将被测试的发音者唇区视频信息作为共振峰参数估计模型的输入,获得该发音者语音的N组共振峰参数;步骤4,对步骤1获得的语音合成激励源和步骤3获得的N组共振峰参数进行语音合成,得到高自然度的合成语音信号;步骤1所述依据雷达回波信号获取语音激励源,具体过程包括:步骤1-1,语音雷达发送正弦连续波,接收天线接收包含声带振动信息的回波信号;步骤1-2,对雷达回波信号进行高通滤波,去除低频直流分量及体动信息,获得信号S;步骤1-3,利用经验小波变换算法对信号S进行模式分解,分解后的第k个模式fkt表示为: 式中,为第k个模式经验小波变换的系数,ψkt为第k个模式经验小波子函数,根据合成需求,选取第一个模式f1t,获得基波X=f1t;步骤1-4,根据合成需求,将基波分为m帧,对第i帧的信号Xi进行中心削波,获得语音合成激励源;其中,中心削波的公式为: 式中,C为削波电平。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京理工大学,其通讯地址为:210094 江苏省南京市玄武区孝陵卫200号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。