买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:东南大学
摘要:本发明公开了一种基于增强注意力双路径卷积循环网络的语音增强方法及设备,方法包括:对含噪训练语音信号进行分帧、加窗处理,计算改进离散余弦变换谱图;构建增强注意力双路径卷积循环网络,由编码器模块、SimAM注意力块、双路径长短时记忆模块、解码器模块和hardtanh函数映射模块组成;将含噪训练语音的改进离散余弦变换谱图、纯净语音分别作为该网络的输入特征和标签,基于组合损失函数训练该增强注意力双路径卷积循环网络;将含噪测试语音信号的改进离散余弦变换谱图作为输入特征,增强注意力双路径卷积循环网络估计对应纯净语音的改进余弦变换谱图,逆变换后得到时域的增强语音。本发明实现了在较小参数量和计算量情况下获得了更好的感知语音质量。
主权项:1.一种基于增强注意力双路径卷积循环网络的语音增强方法,其特征在于,包括如下步骤:步骤1:将单通道的纯净训练语音信号与各种加性噪声按不同信噪比混合,得到若干含噪训练语音信号;步骤2、对含噪训练语音信号进行预处理,并计算预处理后的含噪训练语音信号的改进离散余弦变换谱图;步骤3、构建增强注意力双路径卷积循环网络,所述增强注意力双路径卷积循环网络由包括SimAM注意力模块、双路径长短时记忆模块、hardtanh函数映射模块、若干个编码器模块和若干个解码器模块,若干编码器模块、双路径长短时记忆模块、若干解码器模块、hardtanh函数映射模块依次顺序连接,每个编码器模块与对应的解码器模块之间还通过SimAM注意力模块进行跳转连接,所述编码器模块用于下采样和特征提取,所述解码器模块用于特征处理和上采样,所述双路径长短时记忆模块用于捕获上下文的依赖关系,所述hardtanh函数映射模块用于对改进离散余弦变换谱图进行缩放;步骤4、将含噪训练语音信号的改进离散余弦变换谱图作为增强注意力双路径卷积循环网络的输入特征,纯净训练语音信号作为标签,进行网络训练;步骤5、将待增强的含噪测试语言信号经过预处理后,计算改进离散余弦变换谱图;步骤6、将含噪测试语音信号的改进离散余弦变换谱图作为增强注意力双路径卷积循环网络的输入特征,得到估计纯净语音的改进离散余弦变换谱图,再经过逆改进离散余弦变换和后处理,得到时域增强语音信号。
全文数据:
权利要求:
百度查询: 东南大学 基于增强注意力双路径卷积循环网络的语音增强方法及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。