买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:成都启英泰伦科技有限公司
摘要:一种基于时延神经网络的双麦克风声源定位方法,包括如下步骤:S1.双麦克风音频数据采集和处理;S2.对步骤S1处理后的双麦克风音频数据,计算双麦克风声源定位模型输入特征;S3.构造基于时延神经网络的双麦克风声源定位模型;S4.将得到的输入特征输入双麦克风声源定位模型进行训练,获取最终声源定位模型;将待定位的双麦克风发出的音频数据按照与步骤S2相同的方法计算双麦克风声源定位模型输入特征,输入最终声源定位模型,进行声源定位。本发明通过时延神经网络提升声源定位模型的时序处理和并行计算能力,通过挤压激励模块和残差连接模块提高网络通道信息及多尺度特征融合能力,最终提高了模型方位角度估计的准确率。
主权项:1.一种基于时延神经网络的双麦克风声源定位方法,其特征在于,包括如下步骤:S1.双麦克风音频数据采集和处理;S2.对步骤S1处理后的双麦克风音频数据,计算双麦克风声源定位模型输入特征;S3.构造基于时延神经网络的双麦克风声源定位模型;所述双麦克风声源定位模型包括可学习的特征提取模块、时间窗设置模块、时延神经网络模块、挤压激励模块、自注意力模块和分类模块;所述可学习的特征提取模块,由一个一维卷积神经网络构成;所述时间窗设置模块用于设置时延神经网络的时间窗;所述时延神经网络模块由一个空洞卷积神经网络、RELU激活函数和批归一化层组成;所述挤压激励模块包括挤压阶段和激励阶段;挤压阶段为一个全局平均池化层,激励阶段包括两个全连接层,分别为第一全连接层和第二全连接层;所述自注意力模块,用于为不同的时间帧提供不同的权重;所述分类模块用于计算目标声源方向;S4.将步骤S2中得到的输入特征输入步骤S3构建的双麦克风声源定位模型;利用交叉熵作为训练损失函数进行训练,直至损失函数收敛,获取最终声源定位模型;将待定位的双麦克风发出的音频数据按照与步骤S2相同的方法计算双麦克风声源定位模型输入特征,输入步骤S4得到的最终声源定位模型,进行声源定位;步骤S2采用基于相位变换的广义互相关方法特征作为双麦克风声源定位模型的输入特征,具体计算流程为:S21.计算两个麦克风的互功率谱密度: X1k,l、X2k,l表示两个麦克风的频域信号,其中k和l分别表示信号的频率和帧数,上标*表示共轭;S22.对互功率谱密度PSDk,l进行相位变换,得到互功率谱转换密度: S23.通过傅里叶逆变换IFFT计算互相关函数Rl:Rl=IFFTPSD'k,l其中互相关函数Rl表示第l帧信号的GCC-PHAT特征,维度为K;得到的互相关函数Rl即为双麦克风声源定位模型输入特征,PSD'k,l为互功率谱转换密度。
全文数据:
权利要求:
百度查询: 成都启英泰伦科技有限公司 一种基于时延神经网络的双麦克风声源定位方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。