买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京邮电大学
摘要:本发明公开了一种面向ASV系统的通用语音欺骗检测模型的建立方法,通过引入子网络方法,设计检测LA攻击的LANet,检测PA攻击的PANet以及联合检测LA攻击和PA攻击的混合模型FusionNet。该方法以LANet的浅层参数为基础,构建了一个轻量级的PANet,最后将LANet与PANet输出的embedding进行连接,送入FusionNet中,判定输入语音是否为真实语音。本发明在现有的针对特定攻击的检测模型的基础上,增加少量参数就可构建一个通用的语音欺骗检测模型,该模型既可以检测LA攻击又可以检测PA攻击,解决了现有模型仅能检测特定攻击的问题,同时实现轻量化,从而满足实际应用的需求。
主权项:1.一种面向ASV系统的通用语音欺骗检测模型的建立方法,其特征在于,包括以下步骤:S1、通过数据集中的LA数据训练检测LA攻击的LANet,将LANet的若干个中间层作为检测PA攻击的PANet的浅层,并在训练LANet时,通过在线知识蒸馏对PANet的参数进行初始化;S2、将训练好的LANet参数固定,通过数据集中的PA数据训练PANet;S3、将LANet和PANet的参数固定,把数据集中的LA数据与PA数据送入LANet和PANet,然后将一条语音通过LANet和PANet的最后一层全连接输出的embedding连接起来,训练最终的混合模型FusionNet;S4、将LANet、PANet与FusionNet的参数固定,将最后FusionNet的输出作为判断语音为真假的概率。
全文数据:
权利要求:
百度查询: 北京邮电大学 一种面向ASV系统的通用语音欺骗检测模型的建立方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。