恭喜重庆金美通信有限责任公司陈乔伊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜重庆金美通信有限责任公司申请的专利基于渐进式混响感知网络的语音去混响方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115019818B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210589687.1,技术领域涉及:G10L21/0208;该发明授权基于渐进式混响感知网络的语音去混响方法、装置及设备是由陈乔伊;陈昱帆;唐跃川;杨苏;马枢清设计研发完成,并于2022-05-26向国家知识产权局提交的专利申请。
本基于渐进式混响感知网络的语音去混响方法、装置及设备在说明书摘要公布了:本发明公开了一种基于渐进式混响感知的语音去混响方法、装置及设备。所述语音去混响方法包括利用基于图方法的混响滤波器生成器生成混响滤波器组;构造混响数据集,将纯净语音经过混响滤波器生成混响语音和三个渐进式的目标语音;对混响语音进行短时傅里叶变换从而提取其实部和虚部,并将实部和虚部作为输入特征的两个通道;构造渐进式混响感知网络;将三个渐进式目标语音作为第一、第二、第三监督信息,将混响语音的混响时间作为辅助监督信息,训练渐进式混响感知网络;将测试集中的待增强混响语音做短时傅里叶变换后送入训练好的渐进式混响感知网络,并将网络输出的增强语音的频域结果做短时傅里叶逆变换得到去除混响后的增强语音。
本发明授权基于渐进式混响感知网络的语音去混响方法、装置及设备在权利要求书中公布了:1.一种基于渐进式混响感知网络的语音去混响方法,其特征在于,所述方法包括以下步骤:S1、构造混响滤波器生成器,通过配置生成器的所需参数生成混响滤波器组;S2、构造混响数据集,将语音数据集中的纯净语音经过混响滤波器中,生成混响数据集的混响语音,将纯净语音输入经时间截断后的同参数混响滤波器生成混响语音的第一、第二、第三目标语音;S3、对混响语音进行短时傅里叶变换从而提取其实部和虚部,并将实部和虚部作为输入特征的两个通道;S4、构造出包含多尺度特征提取路径和多分支解码路径的渐进式混响感知网络;S5、将三个目标语音作为渐进式混响感知网络的第一、第二、第三目标语音,利用尺度不变信噪比损失函数最小化增强语音和三个目标语音间的差异,将混响语音的混响时间作为辅助监督信息,利用均方误差损失函数最小化混响时间预测值和混响时间间的差异,训练所述渐进式混响感知网络;S6、获取待增强的混响语音,将待增强的混响语音经过短时傅里叶变换后随即送入训练好的渐进式混响感知网络中,并将第一目标语音所监督的解码分支作为增强语音的频域结果,再经过短时傅里叶逆变换得到去除混响后的增强语音;其中,所述步骤S2中所述的时间截断包括对混响滤波器系统函数进行时间截取从而获得三个系统函数,截取时间段为0-50ms、0-200ms、0-300ms;将纯净语音输入截取后的系统函数,对应生成第一、第二、第三目标语音;所述步骤S5中所述尺度不变信噪比损失函数表示为: 式中,XT和XN分别表示为: XN=fx-XT其中,x表示混响语音,fx表示增强语音,y表示纯净语音,||y||2、||XT||2和||XN||2为2范数结果;步骤S5中所述均方误差损失函数表示为:lMSE=tx-T2其中,x表示混响语音,tx表示混响时间预测值,T表示混响时间真实值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆金美通信有限责任公司,其通讯地址为:400030 重庆市沙坪坝区小杨公桥51号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。