买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖北工业大学
摘要:本发明涉及一种基于电网频率相位时序表征的数字音频篡改被动检测方法及装置,首先对待检测音频数据进行处理得到电网频率ENF成分,基于DFT1变换对ENF成分处理得到ENF相位根据待检测最长时长音频计算出帧数与帧长,并对ENF相位进行分帧处理获取相位时序表征;利用神经网络从ENF相位时序表征中获取ENF时序信息,经过拟合后分类。本发明能够有效提升系统的识别性能提高了模型泛化能力,优化了系统结构,提高了相应设备源识别产品的竞争力。
主权项:1.一种基于电网频率相位时序表征的数字音频篡改被动检测方法,其特征在于,包括对待检测音频数据进行处理得到电网频率(ENF)成分,基于变换对ENF成分处理得到ENF相位;根据待检测最长时长音频计算出帧数与帧长,并对ENF相位进行分帧处理获取相位时序表征;利用神经网络从ENF相位时序表征中获取ENF时序信息,经过拟合后分类;获取ENF相位包括:步骤2.1、计算ENF信号在点n处的近似一阶导数 1其中表示近似求导操作,表示ENF成分第个点的值;步骤2.2、对和进行分帧加窗,帧长为10个标准ENF频率周期,帧移为1个标准ENF频率周期,用汉宁窗对和进行加窗 2 3其中汉宁窗,为窗长;步骤2.3、每帧信号和分别执行N点离散傅里叶变换(DFT)得到、;步骤2.4、令为的峰值的索引;用于求解步骤2.5、由ENF信号的估计频率,可以求出ENF相位特征 4步骤2.6、再估算变换的ENF相位,重新令为的峰值的索引;并将乘一个尺度系数 5得到,;因此估计频率值为 6步骤2.7、应是最接近的整数,为重采样频率,这样才是一个合理的频率值;可将表示为 7其中;对于的值,由进行线性插值求得,令,,表示小于a的最大整数,表示大于b的最小整数;由于,因此在和进行线性插值可以逼近点,求出的值与上式中的的值保持一致; 8步骤2.8、用以上方法求出的,具有两个可能的值,因此使用作为参考,选择中最接近的值作为最终的;计算ENF相位时序表征的具体方法包括:步骤3.1、获取待检测音频数据中的最长时长音频数据;步骤3.2、对最长时长音频,DFT变换获取相位;步骤3.3、设置帧长并根据计算出帧数;步骤3.4、对所有音频数据;计算出帧移;步骤3.5、由于存在无法整除的情况,将分帧分为两个部分,帧的帧移比帧小1;步骤3.6、ENF相位时序表征为;网络模型部分包括:步骤4.1、采用两个双向的长短期记忆神经网络Bi-LSTM模块对ENF相位时序表征进行训练,并输出每个时间步的状态;每个Bi-LSTM模块包含一层双向LSTM层、一层layerNormalization层与激活函数leakyrelu;步骤4.2、将Bi-LSTM网络输出的每个时间步状态特征进行拟合并分类;采用两个全连接层对特征充分拟合,神经元数量分别为1024、256,激活函数为Relu;在两个全连接层之间添加Dropout层,Dropoutrate=0.2,以防止过拟合;最后,通过全连接层作为输出层,神经元数量为2,激活函数为Softmax;步骤4.3、最后输出层得到的概率可得出待测语音是否被篡改,计算所有测试语音正确识别是否被篡改的概率,即系统的识别率。
全文数据:
权利要求:
百度查询: 湖北工业大学 基于电网频率相位时序表征的数字音频篡改被动检测方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。