Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向环境声音识别的完备时序特征提取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:一种面向环境声音识别的完备时序特征提取方法,它属于环境声音信号识别的时序特征提取技术领域。本发明解决了采用现有方法获得的时序表示所包含的时序信息有限的问题。本发明方法可以获得特征维度更高,且不存在冗余信息的完备语义表示子空间,获得的完备语义表示子空间中所含的信息均对完整刻画事件时序信息有效,由于在学习过程中引入了音频段间的时序信息,完备语义表示子空间中包含充分的时序信息,以此来提升环境声音识别的性能、大幅改善识别效率。而且,本发明方法的模型结构简单,对软硬件资源需求低。本发明方法可以用于环境声音信号的完备时序特征提取。

主权项:1.一种面向环境声音识别的完备时序特征提取方法,其特征在于,所述方法具体包括以下步骤:步骤一、对获取的环境声音信号进行预处理后,得到预处理后的环境声音信号;步骤二、对预处理后的环境声音信号进行分帧处理,再分别对分帧处理得到的每帧进行特征提取,利用提取的各帧特征组成预处理后环境声音信号的帧级特征表示序列;步骤三、对预处理后环境声音信号的分帧处理结果进行分段处理,再分别提取出每个音频段的特征,利用各音频段的特征组成预处理后环境声音信号的段级特征表示序列;步骤四、对预处理后环境声音信号的段级特征表示序列进行后处理,得到预处理后环境声音信号的最终的段级特征表示序列;所述后处理包括第一次后处理、第二次后处理以及第三次后处理;步骤五、学习与预处理后环境声音信号的最终段级特征表示序列对应的完备语义表示子空间,获得的完备语义表示子空间即为完备时序特征;所述步骤五的具体过程为:将时序约束下的学习完备语义表示子空间的目标函数表示为: s.t.,DkTanDkTam其中,A是预处理后环境声音信号的最终段级特征表示序列,D∈Rd×p是维度为p的子空间的基矩阵,p为预先指定的子空间维度,Ip×p是维度为p×p的单位矩阵,DT是D的转置矩阵,Dk为基矩阵D中的第k个列向量,an与am分别为A中的第n个和第m个音频段的特征,且nm,‖·‖F代表F范数;将式3的目标函数等价转换为: 其中,Sd,p是由满足列正交关系的全部维度为d×p矩阵组成的Stiefel流形;再计算出流形Sd,p中使目标函数取值达到最小的矩阵D,将D作为预处理后环境声音信号的最终段级特征表示序列对应的完备语义表示子空间。

全文数据:

权利要求:

百度查询: 重庆交通大学 一种面向环境声音识别的完备时序特征提取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。