恭喜腾讯科技(深圳)有限公司夏咸军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜腾讯科技(深圳)有限公司申请的专利语音中检测音乐的方法、语音通信优化方法及对应的装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112750469B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010120889.2,技术领域涉及:G10L25/78;该发明授权语音中检测音乐的方法、语音通信优化方法及对应的装置是由夏咸军设计研发完成,并于2020-02-26向国家知识产权局提交的专利申请。
本语音中检测音乐的方法、语音通信优化方法及对应的装置在说明书摘要公布了:本申请提供了一种语音中检测音乐的方法、语音通信优化方法及对应的装置,方法包括:获取语音片段,并对语音片段进行分帧处理得到至少两帧语音信号;获取每一帧语音信号的特征向量,以及该帧语音信号之前的第一帧数的历史语音信号中各帧历史语音信号的特征向量;将每一帧语音信号的特征向量和对应的各帧历史语音信号的特征向量输入训练好的预设GRU模型,并基于训练好的预设GRU模型的输出结果确定该帧语音信号是否包含音乐。由于GRU模型的输入中除了包含待检测语音信号的特征向量外,还包含了多帧历史语音信号的特征向量,使得GRU模型在计算过程中综合了历史语音信号的特征,提高了单帧语音信号的检测准确率,进而提高了语音片段检测结果的连续性。
本发明授权语音中检测音乐的方法、语音通信优化方法及对应的装置在权利要求书中公布了:1.一种语音中检测音乐的方法,其特征在于,包括:获取语音片段,并对所述语音片段进行分帧处理得到至少两帧语音信号;获取每一帧语音信号的特征向量,以及该帧语音信号之前的第一帧数的历史语音信号中各帧历史语音信号的特征向量;对于每一帧语音信号,将该帧语音信号的特征向量和该帧语音信号对应的各帧历史语音信号的特征向量输入训练好的预设门循环卷积单元GRU模型;基于该帧语音信号和对应的各帧历史语音信号的采样时刻,通过所述预设门循环卷积单元GRU模型逐帧对输入的该帧语音信号和各帧历史语音信号依次进行多次子计算,得到该帧语音信号包含音乐的第一概率;一次子计算的输入包括该帧语音信号和各帧历史语音信号中的一帧语音信号、以及上次子计算的计算结果,最后一次子计算输出的计算结果为该帧语音信号的第一概率;基于所述每一帧语音信号的采样时刻,按照大于第一帧数的第二帧数,获取第二帧数的历史语音信号中各帧历史语音信号包含音乐的第二概率;所述每一帧语音信号和第二帧数的历史语音信号对应的各采样时刻在采样顺序上依次相邻,所述第二概率是由所述预设门循环卷积单元GRU模型得到的;获取每一帧语音信号对应的第一概率与第二帧数的各帧历史语音信号对应的第二概率的平均值,得到所述每一帧语音信号包含音乐的平均概率;若所述平均概率不小于预设门限值,则确定所述每一帧语音信号中包含音乐;其中,所述预设门循环卷积单元GRU模型是通过以下步骤训练得到的:获取预设数量的语音信号样本;其中,所述预设数量的所述语音信号样本包括包含音乐的语音信号样本和不包含音乐的语音信号样本;一个包含音乐的语音信号样本包括一帧包含音乐的语音音乐信号、以及该帧包含音乐的语音信号对应的第一帧数的历史语音信号,且该语音信号样本对应有指示该语音信号样本为包含音乐的标签;一个不包含音乐的语音信号样本包括一帧不包含的语音音乐信号、以及该帧不包含音乐的语音信号对应的第一帧数的历史语音信号,且该语音信号样本对应有指示该语音信号样本为不包含音乐的标签;基于各语音信号样本对所述预设门循环卷积单元GRU模型进行训练,得到训练好的预设门循环卷积单元GRU模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。