首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于三元麦克风阵列的自适应语音降噪方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:昂思科技(定南)有限公司

摘要:本发明公开了一种基于三元麦克风阵列的自适应语音降噪方法。该方法以三元线性麦克风阵列采集语音信号,并对语音信号进行幅值校准,然后,以最小方差无畸变响应波束形成器的输出作为广义旁瓣抵消算法上支路的期望信号;下支路利用阻塞矩阵提取参考噪声信号输入改进的自适应噪声相消模块进行自适应滤波处理,最后使用最优修正对数谱幅度算法进一步消除残留噪声。该方法能有效抑制不同类型的方向性噪声,并具有一定的鲁棒性。

主权项:1.一种基于三元麦克风阵列的自适应语音降噪方法,其特征在于,包括如下步骤:1采用3个麦克风组成的均匀线性阵列采集带噪语音信号:假设在无混响条件下,以第一个麦克风做为参考麦克风,n=0,1,2,...为采样点序列号,第m个麦克风接收到的信号可以写成:y'mn=s'mn+w'mn=am[sn-τm+wn]1,其中,m=1,2,3,y'mn,s'mn,w'mn分别是第m个麦克风采集到的带噪语音、目标语音和噪声,sn是目标语音,wn是噪声,am是幅值系数,τm是第m个麦克风接收到的语音信号相对于参考麦克风接收到的语音信号的延迟采样点数,w'mn和s'mn不相关,在实际运用中,由于麦克风一致性无法达到理想状态和放大电路的影响,导致了麦克风之间的幅值会有误差,为了减小这个误差,在预处理中用一个幅值校准因子Gm去对信号做幅值校准,计算方式如下: Am=medianym1,ym2,…,ymL3, 式中:取前L个采样点计算Am,medianx表示取中位数,g表示所有传感器信号幅值的平均幅值,经幅值校准因子调整后的信号可表示为:ymn=Gmy'mn5,麦克风阵列接收到的带噪语音信号经幅值校准,再进行分帧加窗后,对其进行傅里叶变换,从而得到频域上的矢量形式为: Yl,k=[Y1l,kY2l,kY3l,k]7,Wl,k=[W1l,kW2l,kW3l,k]8, 式中:k=1,2,…为帧索引号,l代表第l个频率点,l=0,1,…,N-1,N为帧长,Yl,k,Sl,k,Wl,k分别是麦克风阵列接收到的语音信号经幅值校准后的带噪语音、目标语音和噪声,表示导向矢量,τ0为相邻麦克风接收到的语音信号之间的延迟采样点数;2最小方差无畸变响应波束形成器MVDR:通过hl,k对Yl,k进行线性滤波,提取所需的语音信号,如式10所示:Zl,k=hHl,kYl,k10,其中,H代表共轭转置,hl,k的求解公式为: 式中:RWl,k为噪声伪谱相干矩阵,为了跟踪环境噪声的变化,RWl,k的更新计算方法如下:使用基于能量和过零率的声音活动检测VAD方法判断当前帧是否为噪声帧,当检测到当前帧不是噪声帧时,当前帧的噪声伪谱相干矩阵RWl,k保持与前一帧的相同,即RWl,k=RWl,k-1;当检测到当前帧为噪声帧而且噪声帧数j不超过设定的值N0时,RWl,k采用如下式12进行更新: 式中Dl,k为当前帧在频点l的协方差频谱矩阵;当检测到当前帧为噪声帧而且噪声帧j超过设定的值N0时,RWl,k采用如下式13进行更新:RWl,k=1-αRWl,k-1+αDl,k13,其中α为设定的学习率,而且0α1,由式10得到广义旁瓣相消GSC结构上支路的期望语音信号Zl,k后,再对其进行逆傅里叶变换得到zn,将其作为改进的自适应噪声消除模块的主输入进行自适应滤波处理;3改进的自适应噪声消除:经过阻塞矩阵后的信号yBn,采用归一化最小均方NLMS与VAD算法相结合的改进自适应滤波算法进行噪声权重向量的迭代更新,利用VAD算法检测噪声帧,仅在噪声帧时更新自适应滤波器的权重系数,其算法流程为:yn=[y1ny2ny3n]14, un+1=un+μyANCnyBn18, 式中:为阻塞矩阵,符号代表自适应滤波器的输出信号,yANCn表示MVDR输出zn与自适应滤波器输出之间的差值,权重向量un用以更新自适应滤波器,其更新公式由式18描述,用于在语音不存在的情况下进行滤波器权重系数的迭代更新,参数μ表示计算权重向量更新的步长,该参数对算法的收敛速度和稳定性产生直接影响,而β0β1则代表归一化步长,符号ε表示一个远小于1的正常数,其存在是为了防止步长μ取值过大,从而降低算法的稳定性;4后置滤波算法:输出语音信号经过改进的ANC算法处理后的yANCn通过短时傅里叶变换转到频域上,再通过最优修正对数谱幅度OMLSA估计器进行后置滤波以进一步消除残留噪声,干净语音每个频点的幅度谱估计值由YANCl,k通过一个谱增益滤波器得到: 谱增益计算函数公式为 式中:xl,k为先验信噪比,γl,k为后验信噪比,pl,k是语音存在概率,ql,k是语音不存在概率,β是控制降噪和语音失真之间平衡的权重因子,GH1为语音存在时的条件增益,Gmin为语音不存在时滤波器的增益下限,λdl,k为噪声功率估计值,是时变平滑参数,最后,对经过谱增益滤波器后的干净语音频谱估计值进行短时傅里叶逆变换得到系统输出的时域信号outn。

全文数据:

权利要求:

百度查询: 昂思科技(定南)有限公司 基于三元麦克风阵列的自适应语音降噪方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。