恭喜广州方硅信息技术有限公司王海平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广州方硅信息技术有限公司申请的专利语音活动检测模型的训练及检测方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115497511B 。
龙图腾网通过国家知识产权局官网在2025-01-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211345386.0,技术领域涉及:G10L25/87;该发明授权语音活动检测模型的训练及检测方法、装置、设备和介质是由王海平设计研发完成,并于2022-10-31向国家知识产权局提交的专利申请。
本语音活动检测模型的训练及检测方法、装置、设备和介质在说明书摘要公布了:本申请涉及音频及直播技术领域,提供一种语音活动检测模型训练及检测方法、装置、设备和介质。本申请能够提高语音活动检测模型的检测精确率。包括:将纯净语音信号样本分帧得到多个纯净语音信号帧样本,获取该多个信号帧样本各自对应的对数能量的归一化值,针对每一信号帧样本,获取该信号帧样本前后第一预设数量个信号帧样本中第一纯净语音信号帧样本的占比,该第一纯净语音信号帧样本为对数能量的归一化值大于阈值的信号帧样本,根据该占比确定该信号帧样本对应的语音活动检测标签,根据信号帧样本和预设噪声得到携带噪声的信号帧样本,利用携带噪声的信号帧样本和语音活动检测标签对待训练的语音活动检测模型进行训练。
本发明授权语音活动检测模型的训练及检测方法、装置、设备和介质在权利要求书中公布了:1.一种语音活动检测模型的训练方法,其特征在于,所述方法包括:获取纯净语音信号样本;将所述纯净语音信号样本进行分帧得到多个纯净语音信号帧样本,获取所述多个纯净语音信号帧样本各自对应的对数能量的归一化值;针对每一纯净语音信号帧样本,根据所述多个纯净语音信号帧样本各自对应的对数能量的归一化值,获取所述纯净语音信号帧样本前后第一预设数量个纯净语音信号帧样本中第一纯净语音信号帧样本的占比;所述第一纯净语音信号帧样本为所述对数能量的归一化值大于归一化值阈值的纯净语音信号帧样本;根据所述第一纯净语音信号帧样本的占比,确定所述纯净语音信号帧样本对应的语音活动检测标签;包括:根据所述第一纯净语音信号帧样本的占比与占比阈值的比较结果,得到所述纯净语音信号帧样本对应的初始语音活动检测标签;针对每一纯净语音信号帧样本,根据所述多个纯净语音信号帧样本各自对应的初始语音活动检测标签,获取所述纯净语音信号帧样本前后第二预设数量个纯净语音信号帧样本中第二纯净语音信号帧样本的数量;所述第二纯净语音信号帧样本为所述初始语音活动检测标签属于第一类标签的纯净语音信号帧样本;根据所述第二纯净语音信号帧样本的数量,确定所述纯净语音信号帧样本对应的语音活动检测标签;根据所述纯净语音信号帧样本和预设噪声信号,得到携带噪声的语音信号帧样本;利用所述携带噪声的语音信号帧样本和所述语音活动检测标签对待训练的语音活动检测模型进行训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州方硅信息技术有限公司,其通讯地址为:510000 广东省广州市番禺区南村镇万博二路79号3108;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。