首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种语音端点检测模型的训练方法及语音降噪方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:清华大学苏州汽车研究院(相城);华研慧声(苏州)电子科技有限公司

摘要:本发明公开了一种语音端点检测模型的训练方法及语音降噪方法,训练方法包括以下步骤:对纯净语音信号进行预处理和端点检测,以得到语音帧和静音帧的真实标签值;加入噪声信号,得到带噪语音信号;提取带噪语音信号的特征值;隐层依据特征值对带噪语音信号进行分类,以得到语音帧和纯噪声帧的估计标签值;对估计标签值与真实标签值进行损失函数计算,根据计算结果以优化语音端点检测模型的模型参数。本发明提供的语音端点检测模型的训练方法及语音降噪方法融合了深度学习思想,构建循环神经网络模型,基于数据驱动,计算算法中需要的估计参数值,得到更准确的噪声统计分布规律,进而达到较为理想的降噪效果。

主权项:1.一种语音端点检测模型的训练方法,其特征在于,所述语音端点检测模型基于神经网络模型,其用于对带噪语音进行端点检测,所述语音端点检测模型包括输入层、多个隐层以及输出层,至少有一个隐层包括GRU层和或LSTM层;所述隐层包括第一隐层、第二隐层、第三隐层和优化隐层,所述优化隐层位于所述第一隐层和第二隐层之间,所述第一隐层包括全连接层和tanh激活函数层,所述第二隐层包括ReLU激活函数层,第三隐层包括全连接层和sigmoid激活函数层,所述第二隐层还包括GRU层,特征值依次经过全连接层、tanh激活函数层、GRU层、ReLU激活函数层、全连接层、sigmoid激活函数层处理,以得到语音帧和纯噪声帧的估计标签值;所述第二隐层还包括LSTM层,所述特征值依次经过全连接层、tanh激活函数层、LSTM层、ReLU激活函数层、全连接层、sigmoid激活函数层处理,以得到语音帧和纯噪声帧的估计标签值;所述优化隐层包括GRU层和tanh激活函数层,所述第一隐层的输出依次经GRU层和tanh激活函数层处理至所述第二隐层;所述优化隐层包括全连接层和ReLU激活函数层,所述第一隐层的输出依次经全连接层和ReLU激活函数层处理至所述第二隐层;所述优化隐层包括全连接层层和tanh激活函数层,所述第一隐层的输出依次经全连接层和tanh激活函数层处理至所述第二隐层;所述训练方法包括以下步骤:S1、对纯净语音信号进行预处理和端点检测,以得到语音帧和静音帧的真实标签值;S2、在带有标签值的纯净语音信号中加入噪声信号,得到带噪语音信号,其包含对应纯净语音信号端点检测后的真实标签值;S3、提取所述带噪语音信号的fbank特征、MFCC特征、谱熵特征、倒谱距离特征、PLP特征中的一种或多种,以得到所述语音端点检测模型输入的特征值;S4、将所述特征值输入至所述输入层,所述隐层依据所述特征值对所述带噪语音信号进行分类,以得到语音帧和纯噪声帧的估计标签值,并通过所述输出层进行输出;S5、对所述估计标签值与所述真实标签值进行损失函数计算,根据计算结果以优化所述语音端点检测模型的模型参数。

全文数据:

权利要求:

百度查询: 清华大学苏州汽车研究院(相城) 华研慧声(苏州)电子科技有限公司 一种语音端点检测模型的训练方法及语音降噪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。