首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨理工大学

摘要:本发明公开了一种声纹欺诈检测方法,将能量谱经由Q‑DCT和Q‑IDCT平滑处理的重构群延迟‑常数Q变换以下称为RGD‑CQT语谱图特征进行检测语音欺诈攻击的方法,解决了欺诈语音特征区分性不强及欺诈语音检测系统错误率高的问题。在训练时,先对语音序列进行填充或截取操作,进而将语音序列的每一位与索引序号加一的值进行相乘,获得新的语音序列。将两个语音序列分别进行常数Q变换CQT,constantQtransform,获得两个语谱图X和Y。分别提取两张语谱图的实部和虚部,对语谱图X进行Q‑DCT和Q‑IDCT,之后进行修改的群延迟的计算,最后进行归一化和取对数得到最终的语谱图。将其作为resnet18+cbam网络的输入;然后通过交叉熵损失和Adam优化器训练出一个最优的网络模型作为用于测试的模型。最终根据网络模型的分数,如果分数大于0则认为是真实语音,反之,则判断为欺诈语音。

主权项:1.一种声纹欺诈检测方法,基于CQT修改的离散余弦变换压缩数据和基于CQT语谱图修改的群延迟信息进行检测语音欺诈攻击的方法,主要包括以下步骤:步骤1、将数据集中的每一个从音频文件中读取的语音序列进行预处理操作,使每一个语音序列的长度一致,输出长度为n的语音序列xn;步骤2、将步骤1中读取的语音序列xn作为输入,计算yn=xn×n+1,n=0,1,...,n;步骤3、将步骤1和2中获得的序列xn和yn进行CQT变换,分别求出语谱图X和语谱图Y,然后将获得的语谱图X和语谱图Y分别提取其实部Xr,Yr和虚部Xi,Yi;步骤4、将步骤3中获得的语谱图X取其能量谱,进行特征重构得到中间语谱图;步骤5、将步骤3和步骤4中获得语谱图进行群延迟的计算,得到GD语谱图;步骤6、将步骤5中获得的GD语谱图进行归一化、取对数处理,得到RGD-CQT语谱图;步骤7、将步骤6中获得的RGD-CQT语谱图传入含有注意力机制的残差网络模型中进行训练,得到最优的网络模型;步骤8、将步骤7中获得的最优网络模型作为测试模型,将待测语音传入该模型中,进而判断该语音是否是欺诈语音;进一步地,步骤1中所述的预处理操作,是对每一个音频序列进行填充和截取;若序列长度小于规定长度则进行填充操作;若序列长度大于规定长度则进行截取操作,使这些序列的长度一致;进一步地,步骤3中获取Xr,Yr,Xi,Yi的计算步骤为:1对xn和yn分别进行CQT的计算,得到两个语谱图,语谱图X和语谱图Y;2取出语谱图X的实部Xr和虚部Xi,取出语谱图Y的实部Yr和虚部Yi;进一步地,步骤4中将语谱图X的能量谱进行特征重构的具体过程为:1首先提取语谱图X的幅度谱Xmag;2对幅度谱中Xmag每个元素求取平方,求出能量谱S;3对这个能量谱S进行中值滤波,即把能量谱中每一个像素点的灰度值用该点的一个邻域中各点值的中值代替,从而消除孤立的噪声点;4最后对能量谱S进行特征重构得到中间语谱图;其中特征重构中的一维Q-DCT推导过程为:1原始的CQT公式为: 其中,定义加窗后的声音序列为xn,n=0,1,...,Nk-1,Nk为第k个频率下的采样点数;Xk为频谱,Q是中心频率与带宽的比;将长度为n的序列xn扩展为原来的2倍,{x[-Nk],x[-Nk+1],...,x[0],x[1],...,x[Nk-1]}; 其中,x'm∈{x[-Nk],x[-Nk+1],...,x[0],x[1],...,x[Nk-1]};2将序列x'm向右平移12得: 3对公式3中的取正数,得到以下形式: 4令得到以下形式: 由上述推导过程可知,一维的Q-DCT如6式所示: 二维的Q-DCT是在一维的基础上,再进行一次Q-DCT,因此二维的Q-DCT公式7为: 其中,和分别为时域和频域的采样点数;二维的Q-DCT计算看作是能量谱S分别左乘矩阵A和右乘矩阵B,得到新的语谱图Xdct,即Xdct=AXmagB;然后对Xdct进行逆变换,即左乘A-1和右乘B-1,得到中间语谱图X1,即X1=A-1XdctB-1;进一步地,步骤5中计算群延迟特征,得到GD语谱图,具体的计算公式为: 进一步地,步骤6中对群延迟特征进行归一化、取对数,具体计算过程为:1对GD语谱图中的元素进行归一化,得到新的语谱MGD,计算公式为:2求出MGD语谱图中最大的元素max,再对MGD语谱图中的每个元素都除以语谱图中的最大值max,得到新的语谱图MGDmax,即3对语谱图MGDmax取对数,获得最终的特征RGD-CQT语谱图。

全文数据:

权利要求:

百度查询: 哈尔滨理工大学 基于重构群延迟-常数Q变换语谱图的声纹欺诈检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。