视听场景下的听觉注意解码方法、装置和助听系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：安徽大学

摘要：本申请涉及一种视听场景下的听觉注意解码方法、装置和助听系统，其中，该目标说话者定位方法包括；实时获取听者的脑电信号和视野图像；其中，所述脑电信号通过佩戴于听者头部的脑电信号采集设备采集得到，所述视野图像通过与听者头部同步运动的图像采集设备采集得到；将所述脑电信号和所述视野图像输入基于机器学习的听觉注意解码模型，通过所述听觉注意解码模型得到目标说话者的空间方位。本发明充分考虑了实际场景中可用于定位目标说话者的信息，进而能够更加准确地锁定目标说话者的空间方位，改进了现有的听觉注意解码算法，可以更加充分地注意目标说话者的声音，解决了目前的听觉注意解码算法对目标声源的定位准确性较低的问题。

主权项：1.一种视听场景下的听觉注意解码方法，其特征在于，包括：实时获取听者的脑电信号和视野图像；其中，所述脑电信号通过佩戴于听者头部的脑电信号采集设备采集得到，所述视野图像通过与听者头部同步运动的图像采集设备采集得到；将所述脑电信号和所述视野图像输入基于机器学习的听觉注意解码模型，通过所述听觉注意解码模型得到目标说话者的空间方位，所述目标说话者为所述听者关注的说话者；其中，所述听觉注意解码模型包括脑电模态流模块、视觉模态流模块、特征融合模块和带有激活函数的第一全连接层；通过所述听觉注意解码模型得到目标说话者的空间方位，包括：通过所述脑电模态流模块对所述脑电信号进行特征提取得到目标脑电特征；通过所述视觉模态流模块对所述视野图像进行特征提取得到目标视觉特征；通过特征融合模块对所述目标脑电特征和所述目标视觉特征进行融合得到多模态特征；通过所述第一全连接层对所述多模态特征进行预测得到预测结果；根据所述预测结果确定目标说话者的空间方位；其中，根据所述预测结果确定目标说话者的空间方位，包括：当所述目标说话者处于听者空间左侧的概率大于处于听者空间右侧的概率时，确定所述目标说话者处于听者空间左侧；当所述目标说话者处于听者空间左侧的概率小于处于听者空间右侧的概率时，确定所述目标说话者处于听者空间右侧；其中，所述脑电模态流模块包括卷积层、平均池化层、第一展平层和带有激活函数的第二全连接层；通过所述脑电模态流模块对所述脑电信号进行特征提取得到目标脑电特征，包括：依次通过所述卷积层和所述平均池化层对所述脑电信号进行处理得到中间脑电特征；依次通过所述第一展平层和所述第二全连接层对所述中间脑电特征进行处理得到所述目标脑电特征；其中，所述中间脑电特征的提取公式如下：，其中，XEEG表示脑电信号，FEEG表示中间脑电特征，conv表示卷积操作，avgpool表示平均池化操作；所述目标脑电特征的提取公式如下：，其中，表示目标脑电特征，flatten表示展平操作，dense表示全连接操作，sigmoid表示归一化激活操作；其中，所述视觉模态流模块包括VGG16模型、第二展平层和带有激活函数的三个第三全连接层；通过所述视觉模态流模块对所述视野图像进行特征提取得到目标视觉特征，包括：通过预训练的所述VGG16模型对所述视野图像进行特征提取得到中间视觉特征；依次通过所述第二展平层和三个所述第三全连接层对所述中间视觉特征进行处理得到所述目标视觉特征；其中，所述中间视觉特征的提取公式如下：，其中，XImg表示视野图像，FImg表示中间视觉特征，vgg16表示VGG16模型的特征提取操作；所述目标视觉特征的提取公式如下：，其中，表示目标视觉特征，flatten表示展平操作，dense表示全连接操作，relu表示线性整流操作，sigmoid表示归一化激活操作。

全文数据：

权利要求：

百度查询：安徽大学视听场景下的听觉注意解码方法、装置和助听系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种模拟飞行环境测试发动机内流特性的试验装置与方法

下一篇：卷铁心及其制造方法

相关技术

一种模拟飞行环境测试发动机内流特性的试验装置与方法

卷铁心及其制造方法

一种用于组装工件与载具的装置

一种铸件砂芯芯盒及其制作方法

车辆隔板结构

一种射频连接器外壳的制备方法以及射频连接器

一种掺烧煤泥的循环流化床锅炉前墙水冷壁管结构

一种生物基多孔酸性催化剂及其制备方法与应用

简易式快拆模块化球类器材

一种铰点支座防变形焊接系统

具有节能、低功耗的平面发声透明音箱

一种用于通信声呐的全时间取样方法及系统

方法相关技术

通信方法、码本指示方法、通信装置_北京紫光展锐通信技术有限公司_202310363970.7

萃取方法_阿里山制酒股份有限公司_202410147785.9

地震资料前处理方法、静校正处理方法及构造成像方法_中国石油化工股份有限公司_202310355196.5

一种页面处理方法、编译方法、渲染方法及装置_抖音视界有限公司_202310348131.8

胸罩、增大胸部的方法、塑造大胸部的方法_山川谦辅_202380013191.2

数据单元的发送方法、接收方法及装置_华为技术有限公司_201910657446.4

参考信号的发送方法,接收方法和装置_华为技术有限公司_202310403960.1

游戏资源的推荐方法、游戏试玩方法及装置_咪咕互动娱乐有限公司_202410958184.6

标定参数确定方法、校正方法、介质及设备_湖南视比特机器人有限公司_202410971596.3

信号发射方法、信号接收方法及存储介质_重庆智铸达讯通信有限公司_202411055871.3

解码相关技术

运动图像解码装置_夏普株式会社_202411121404.6

异步解码方法及装置_珠海全志科技股份有限公司_202310332541.3

视频编码和解码装置_杜比实验室特许公司_202411011114.6

一种图像解码方法、图像解码系统及相关装置_郑州云海信息技术有限公司_202111143450.2

用于解码编码树单位的块的方法和视频解码设备_佳能株式会社_202411167629.5

视频编解码方法和装置_北京三星通信技术研究有限公司_202010474296.6

用于编码和解码编码树单位的块的方法、编码设备和视频解码设备_佳能株式会社_202411167623.8

一种独立解码和联合解码相结合的RGB-T图像显著目标检测方法_安徽大学_202110933152.7

用于编码和解码编码树单位的块的方法、编码设备和视频解码设备_佳能株式会社_202411167620.4

用于视频编码和解码的装置、方法_诺基亚技术有限公司_202080044882.5

注意相关技术

基于多尺度感知及参考注意力的SAR目标识别方法_西安电子科技大学_202410762952.0

一种利用多头注意力和并联连接的喉镜图像分类方法_浙江工业大学_202410766154.5

一种基于多头注意力机制的惯性导航方法_天津大学_202210438885.8

一种听觉注意力训练的耳鸣治疗装置_海南省人民医院_202411122785.X

基于递归扩张注意力的孪生网络的目标跟踪方法与系统_南昌工程学院_202411273428.3

基于注意力机制和轻量化卷积的遥感图像目标检测方法_盐城工学院_202410808919.7

一种基于图注意力网络的中文短文本分类方法_电子科技大学_202410907715.9

基于多任务学习和注意力机制的命名实体识别模型_中国矿业大学(北京)_202311450661.X

一种治疗注意缺陷多动障碍的外用中药组合物及其应用_上海市静安区精神卫生中心(上海市静安区疾病预防控制精神卫生分中心)_202410976479.6

基于注意力机制和候选感知的信息推荐方法_广州番禺职业技术学院_202410906100.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

视听场景下的听觉注意解码方法、装置和助听系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务