首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于多头注意力的弱监督音频分类方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州一知智能科技有限公司

摘要:本发明公开了一种基于多头注意力的弱监督音频分类方法及系统,属于音频处理和深度学习技术领域。获取智能外呼系统呼叫失败时的音频历史数据,并标注弱监督标签,再进行预处理,对预处理后的音频历史数据进行梅尔频谱计算,得到梅尔频谱表示,提取得到频谱中的局部模式和相关性,进行降采样,并加入预处理后的音频历史数据中每一帧音频数据的位置信息,得到中间输出;基于多头注意力机制网络和分类网络获得音频的分类结果;并对两个网络的参数更新,获得预训练的多头注意力机制网络和分类网络;利用获得的网络对待分类的音频进行分类,识别得到呼叫失败的原因。本发明可以根据具体需求进行调整和优化,适用于各种规模的音频处理任务。

主权项:1.一种基于多头注意力的弱监督音频分类方法,其特征在于,包括:获取智能外呼系统呼叫失败时的音频历史数据,并标注弱监督标签;对标注后的音频历史数据进行预处理,对预处理后的音频历史数据进行梅尔频谱计算,得到梅尔频谱表示;提取梅尔频谱表示的局部特征,所述局部特征表征频谱的局部模式和相关性;对局部特征降采样并加入预处理后的音频历史数据中每一帧音频的位置信息,得到中间输出;利用多头注意力机制网络获得中间输出的更高维度的向量,再利用分类网络对所述向量进行分类,得到音频的分类结果;根据分类结果及弱监督标签更新多头注意力机制网络和分类网络的参数,获得预训练的多头注意力机制网络和分类网络;利用预训练的多头注意力机制网络和分类网络对智能外呼系统呼叫失败时的音频进行分类,识别得到呼叫失败的原因。

全文数据:

权利要求:

百度查询: 杭州一知智能科技有限公司 基于多头注意力的弱监督音频分类方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。