恭喜广州大学张承云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广州大学申请的专利一种声音识别模型的训练方法、识别方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115346536B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210813780.6,技术领域涉及:G10L17/26;该发明授权一种声音识别模型的训练方法、识别方法、设备及介质是由张承云;詹海松;高星辉;李清荣;李一帆设计研发完成,并于2022-07-12向国家知识产权局提交的专利申请。
本一种声音识别模型的训练方法、识别方法、设备及介质在说明书摘要公布了:本发明公开了一种声音识别模型的训练方法、识别方法、设备及介质,本发明通过对声音数据集进行第一能量值计算,根据第一能量值计算结果进行第一筛选处理,得到第一数据;对第一数据进行增益处理、滤波频域增强处理以及乱序合并处理,并对增益处理结果、滤波频域增强处理结果以及乱序合并处理结果中的至少之一进行组合,有利于增加声音识别模型训练过程中对可能携带各种噪声的数据的鲁棒性;对第二数据进行梅尔谱计算得到训练样本,将训练样本输入教师网络训练得到教师网络模型,将训练样本输入学生网络并根据教师网络模型对学生网络进行蒸馏学习,得到声音识别模型,轻量化且提升了识别能力,本发明可广泛应用于数据处理技术领域。
本发明授权一种声音识别模型的训练方法、识别方法、设备及介质在权利要求书中公布了:1.一种声音识别模型的训练方法,其特征在于,包括:获取声音数据集;对所述声音数据集进行第一能量值计算,根据第一能量值计算结果进行第一筛选处理,得到第一数据;对所述第一数据进行增益处理、滤波频域增强处理以及乱序合并处理,并对增益处理结果、滤波频域增强处理结果以及乱序合并处理结果中的至少之一进行组合,得到第二数据;所述滤波频域增强处理包括指向性衰减增强处理以及数据频域随机增强处理;对所述第二数据进行梅尔谱计算,得到训练样本;将所述训练样本输入教师网络训练得到教师网络模型,将所述训练样本输入学生网络并根据所述教师网络模型对所述学生网络进行蒸馏学习,得到声音识别模型;所述对所述第一数据进行增益处理、滤波频域增强处理,包括:对所述第一数据进行切片处理得到若干个切片数据,从第一预设增益范围中选取第一数值,根据所述第一数值以及预设偏移量确定第二数值,将所述第二数值分别与所述切片数据进行第一相乘,将第一相乘结果重新合成,得到增益处理结果;所述指向性衰减增强处理为:从预设频率范围确定截止频率,通过所述截止频率对所述第一数据进行滤波处理,得到第一增强数据;所述数据频域随机增强处理为:对所述第一数据进行第一分帧加窗处理,并对第一分帧加窗处理结果进行第二离散傅里叶变换,得到第二幅度谱以及相位谱,对所述第二幅度谱进行频带切分,得到若干个频带,根据第二预设增益范围确定增益值,将所述增益值分别与所述频带进行第二相乘,将第二相乘结果进行拼接,根据所述相位谱以及拼接后的第二相乘结果进行逆傅里叶变换转换,得到第二增强数据;所述滤波频域增强处理结果包括所述第一增强数据以及所述第二增强数据;所述训练样本具有真实标签;所述将所述训练样本输入学生网络并根据所述教师网络模型对所述学生网络进行蒸馏学习,得到声音识别模型,包括:将所述训练样本输入至所述教师网络模型,得到预测标签;将所述训练样本输入至学生网络,以在第一温度下得到第一预测结果以及在第二温度下得到第二预测结果;根据所述第一预测结果以及所述预测标签计算蒸馏损失,根据所述第二预测结果以及所述真实标签计算学生损失,计算所述蒸馏损失与第一权重的第一乘积并计算所述学生损失与第二权重的第二乘积,根据所述第一乘积以及所述第二乘积的和确定损失值;返回所述将所述训练样本输入至所述教师网络模型的步骤,直至训练次数或者所述损失值满足预设条件,得到声音识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学,其通讯地址为:510006 广东省广州市大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。