首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种声源定位的高精度实现方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:苏州大学

摘要:本发明属于声源定位的技术领域,公开了一种声源定位的高精度实现方法,包括利用双通道特性,并基于声源估计算法,计算各麦克风阵列之间的关系函数;通过构建二十面体特征注意力网络模型进行特征提取;对特征进行学习,实现高精度声源定位。本发明提供的一种声源定位的高精度实现方法,通过提出一种二十面体特征注意力网络模型满足了人工智能领域和工业领域对高精度声源定位的迫切需求,减少目前高精度声源定位的实现成本,有着很好的实用性。

主权项:1.一种声源定位的高精度实现方法,其特征在于,包括:利用双通道特性,并基于声源估计算法,计算各麦克风阵列之间的关系函数;通过构建二十面体特征注意力网络模型进行特征提取;所述二十面体特征注意力网络模型包括特征提取模块、特征残差学习模块、特征注意力权重模块和特征融合学习模块;通过特征提取模块得出两个特征值作为整个系统提取的特征,随后进入特征残差学习模块、特征注意权值模块和特征融合学习模块,通过对提取的特征进行学习训练,提升定位精度;将SRP-PHAT映射和SRP-LMS映射投入二十面体网格中,得到相应的二十面体SRP功率谱图;将二十面体SRP功率谱图输入特征提取模块,得到二十面体特征1和二十面体特征2;所述二十面体SRP功率谱图包括二十面体SRP-PHAT功率谱图和二十面体SRP-LMS功率谱图,输入特征是维度为B×T×C×R×5×H×W的七维张量;其中,B为批量大小,T为时间维度,C是通道维数,R是二十面体卷积所需的六个通道,开始时输入特征标量R的值为1,5是图表的数量,H和W分别为输入特征的二十面体网格的长度和宽度;对特征进行学习,实现高精度声源定位;所述特征残差学习模块包括卷积层、Relu激活层和残差结构;对特征残差学习模块的输入二十面体特征1和二十面体特征2得到增强特征1和增强特征2;所述特征注意力权重模块包括归一化、卷积层、relu激活函数、sigmod激活函数和池化层;所述特征注意力权重模块的输入为所述特征残差学习模块的输入和输出特征;对增强特征采用二十面体层归一化层得到输入通道维度和二十面体卷积通道维度上相对应的描述符,所述描述符f表示为:f=LNormIco增强特征所述描述符f经过两个卷积层以及一个ReLU函数激活,最后结合sigmod层,反馈两类特征在不同环境下的自适应权系数,所述自适应权系数w表示为:w=SigmoidIcoConvρIcoConvf其中,Sigmoid为Sigmoid激活函数,ρ表示ReLU激活函数,IcoConv为二十面体卷积;将所述自适应权系数与增强特征1和增强特征2相乘得到自适应特征;将输入的二十面体特征1和二十面体特征2与自适应特征相加结合得到融合特征;所述融合特征结合了二十面体卷积核和一维卷积的学习前一帧信息;将所述融合特征输入特征融合学习模块,得到静态和动态声源定位信息。

全文数据:

权利要求:

百度查询: 苏州大学 一种声源定位的高精度实现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。