一种语音端点检测模型的训练方法及语音降噪方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：清华大学苏州汽车研究院(相城);华研慧声(苏州)电子科技有限公司

摘要：本发明公开了一种语音端点检测模型的训练方法及语音降噪方法，训练方法包括以下步骤：对纯净语音信号进行预处理和端点检测，以得到语音帧和静音帧的真实标签值；加入噪声信号，得到带噪语音信号；提取带噪语音信号的特征值；隐层依据特征值对带噪语音信号进行分类，以得到语音帧和纯噪声帧的估计标签值；对估计标签值与真实标签值进行损失函数计算，根据计算结果以优化语音端点检测模型的模型参数。本发明提供的语音端点检测模型的训练方法及语音降噪方法融合了深度学习思想，构建循环神经网络模型，基于数据驱动，计算算法中需要的估计参数值，得到更准确的噪声统计分布规律，进而达到较为理想的降噪效果。

主权项：1.一种语音端点检测模型的训练方法，其特征在于，所述语音端点检测模型基于神经网络模型，其用于对带噪语音进行端点检测，所述语音端点检测模型包括输入层、多个隐层以及输出层，至少有一个隐层包括GRU层和或LSTM层；所述隐层包括第一隐层、第二隐层、第三隐层和优化隐层，所述优化隐层位于所述第一隐层和第二隐层之间，所述第一隐层包括全连接层和tanh激活函数层，所述第二隐层包括ReLU激活函数层，第三隐层包括全连接层和sigmoid激活函数层，所述第二隐层还包括GRU层，特征值依次经过全连接层、tanh激活函数层、GRU层、ReLU激活函数层、全连接层、sigmoid激活函数层处理，以得到语音帧和纯噪声帧的估计标签值；所述第二隐层还包括LSTM层，所述特征值依次经过全连接层、tanh激活函数层、LSTM层、ReLU激活函数层、全连接层、sigmoid激活函数层处理，以得到语音帧和纯噪声帧的估计标签值；所述优化隐层包括GRU层和tanh激活函数层，所述第一隐层的输出依次经GRU层和tanh激活函数层处理至所述第二隐层；所述优化隐层包括全连接层和ReLU激活函数层，所述第一隐层的输出依次经全连接层和ReLU激活函数层处理至所述第二隐层；所述优化隐层包括全连接层层和tanh激活函数层，所述第一隐层的输出依次经全连接层和tanh激活函数层处理至所述第二隐层；所述训练方法包括以下步骤：S1、对纯净语音信号进行预处理和端点检测，以得到语音帧和静音帧的真实标签值；S2、在带有标签值的纯净语音信号中加入噪声信号，得到带噪语音信号，其包含对应纯净语音信号端点检测后的真实标签值；S3、提取所述带噪语音信号的fbank特征、MFCC特征、谱熵特征、倒谱距离特征、PLP特征中的一种或多种，以得到所述语音端点检测模型输入的特征值；S4、将所述特征值输入至所述输入层，所述隐层依据所述特征值对所述带噪语音信号进行分类，以得到语音帧和纯噪声帧的估计标签值，并通过所述输出层进行输出；S5、对所述估计标签值与所述真实标签值进行损失函数计算，根据计算结果以优化所述语音端点检测模型的模型参数。

全文数据：

权利要求：

百度查询：清华大学苏州汽车研究院(相城) 华研慧声(苏州)电子科技有限公司一种语音端点检测模型的训练方法及语音降噪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：光隔离单元和共轴收发模块及激光雷达

下一篇：一种工业用空气过滤装置

相关技术

光隔离单元和共轴收发模块及激光雷达

一种工业用空气过滤装置

一种优化机器人外呼系统打断效果的方法及装置

一种燃气管道用支吊架结构

一种清洁装置及抽水系统

一类适用于多种波长光刻的联苯类非化学放大型光刻胶及其制备方法和应用

一种基于统计-动力相结合的传染病预测方法及系统

一种改进的无动力精馏工艺

一种模块化的配电终端三遥故障模拟训练系统

一种物料运输重型半挂车

一种油茶粕提取物及其提取方法与在制备抗结肠癌药物中的应用

一种地质矿产资源勘查用金属检测装置及检测方法

方法相关技术

干燥方法_乔治费歇尔管路系统公开股份有限公司_202410236019.X

哺乳动物精子的制备方法、人工授精方法和体外受精方法_国立大学法人广岛大学_202380018296.7

喷液头、喷液装置、喷液方法、物品的制造方法、记录方法_佳能株式会社_202410225782.2

土壤气取样器、取样方法、检测方法及动态变化监测方法_河北高斯环保科技有限公司_202410801067.9

LED灯板及其制备方法、基板及其制备方法_深圳市艾比森光电股份有限公司_202410601499.5

推荐方法、推荐模型训练方法及相关装置_行吟信息科技(上海)有限公司_202410630521.9

工业程序的编译方法、运行方法及相关装置_北京和利时系统工程有限公司_202410839364.2

苦白蹄多糖制备方法、鉴定方法和应用_南开大学_202310183021.0

轻量级加密方法、解密方法、相关设备及车辆_北京邮电大学_202410739174.3

加密存储方法、解密提取方法、装置、设备及介质_苏州元脑智能科技有限公司_202410635594.7

训练相关技术

上下肢训练装置_福建野小兽健康科技有限公司_202420063878.9

手臂康复训练设备_长春工业大学_202322688550.4

分布式训练系统_杰创智能科技股份有限公司_202410826688.2

手臂康复训练机构_长春工业大学_202322688568.4

一种隧道救援训练设施与训练方法_中国建筑科学研究院有限公司_202410772906.9

视频定位模型训练方法_成都考拉悠然科技有限公司_202411054298.4

一种牵伸训练装置_十堰市太和医院(湖北医药学院附属医院)_202323335762.0

一种张口训练器_贵港市人民医院_202322840764.9

一种眼部训练仪_黄启园_202323643356.0

一种声乐训练辅助装置_刘晓飞_202323367265.9

模型相关技术

车辆驱动系统的模型_上海科梁信息科技股份有限公司_202410735998.3

基于上下文模型的Instant-NGP模型压缩方法_上海交通大学_202410704702.1

一种基于NARX模型的大模型训练慢节点检测方法_天翼云科技有限公司_202410864138.X

增强多模态大语言模型视觉感知能力的方法、模型和装置_华中科技大学_202410716799.8

模型训练方法和基于模型的场景流估计方法_天津港(集团)有限公司_202411061324.6

电机轴承剩余寿命预测方法、系统、模型及模型训练方法_成都赛力斯科技有限公司_202411052755.6

牙齿模型套具及复层根管治疗术练习模型_北京大学口腔医学院_202410865138.1

模型训练方法、模型推理方法、电子设备及存储介质_上海壁仞科技股份有限公司_202410912446.5

用于分割的双级别模型_脸萌有限公司_202380018666.7

用于模型解释的方法及装置_支付宝(杭州)信息技术有限公司_202210369552.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种语音端点检测模型的训练方法及语音降噪方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务