买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请提供了一种音频处理方法及电子设备。该方法包括:将目标音频对应的已分离语音信号输入已训练好的说话人及内容提取模型,由说话人及内容提取模型输出已分离语音信号对应的目标说话内容和至少两个备选说话人;根据至少两个备选说话人的历史说话内容和目标说话内容,从至少两个备选说话人中确定目标说话内容对应的目标说话人。这样,通过采用基于融合训练的端到端方案,并辅助以语义信息对说话人辨识结果再矫正,提升了说话人身份辨识聚类的鲁棒性,进而提升了整个音频处理算法的鲁棒性。
主权项:1.一种音频处理方法,其特征在于,应用于电子设备,所述方法包括:对目标音频进行语音活跃性检测,得到待分离语音信号;检测所述待分离语音信号中的说话人变更点;根据检测出的说话人变更点,将所述待分离语音信号分割为多个已分离语音信号;将目标音频对应的已分离语音信号输入已训练好的说话人及内容提取模型,由所述说话人及内容提取模型输出所述已分离语音信号对应的目标说话内容和至少两个备选说话人;根据所述至少两个备选说话人的历史说话内容和所述目标说话内容,从所述至少两个备选说话人中确定所述目标说话内容对应的目标说话人。
全文数据:
权利要求:
百度查询: 上海荣耀智慧科技开发有限公司 音频处理方法及电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。