买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
摘要:本发明公开了一种智能识别环境噪声类别的方法、系统及存储介质,包括:将环境噪声划分为多个环境噪声类别;针对各环境噪声类别,均采集一段声音文件,并人工打标噪声类别标签;对已打标噪声类别标签的各声音文件进行预处理,获取预处理后的若干声音片段;对预处理后的各声音片段进行特征提取,获取各声音片段特征;基于所述环境噪声类别和所述声音片段特征构建噪声类别识别模型;将各声音片段特征输入噪声类别识别模型进行模型训练,并利用训练后的所述噪声类别识别模型识别待识别声音片段的噪声类型及其对应的置信度。本发明完善了当前的环境噪声监测指标以及可为噪声治理提供依据。
主权项:1.一种智能识别环境噪声类别的方法,其特征在于,所述方法包括以下步骤:将环境噪声划分为多个环境噪声类别;针对各环境噪声类别,均采集一段声音文件,并人工打标噪声类别标签;对已打标噪声类别标签的各声音文件进行预处理,获取预处理后的若干声音片段;对预处理后的各声音片段进行特征提取,获取各声音片段特征;基于所述环境噪声类别和所述声音片段特征构建噪声类别识别模型;将各声音片段特征输入噪声类别识别模型进行模型训练,并利用训练后的所述噪声类别识别模型识别待识别声音片段的噪声类型及其对应的置信度;对预处理后的各声音片段进行特征提取,获取各声音片段特征,过程包括:提取各声音片段的M行N列梅尔频谱图矩阵;将各声音片段的原时域信号缩放为包含N个数据点的时域信号矢量,将所述时域信号矢量与所述梅尔频谱图矩阵合并为M+1行N列的混合信号矩阵,所述时域信号矢量为所述混合信号矩阵的第一行;基于所述混合信号矩阵包含的信号,提取出对不同声音类型具有判别性的声音片段特征;针对多个环境噪声类别,分别构建所述噪声类别识别模型,具体包括:将所述M+1行N列的混合信号矩阵转换为包含M+1*N个元素的行向量;将用于训练的R个声音片段构成一个R行、M+1*N列的矩阵P;从R个声音片段中挑选出包含某类别的声音片段,将类别标签设置为元素值1与0的二维行向量,针对不含某类别的声音片段,将其类别标签设置为元素值为0与1的二维行向量,最终将R个声音片段的类别标签向量构成一个R行、2列的矩阵Q;设定P与Q之间存在Py=Q的关系,y表示未知数,利用求出y的近似值,其中代表矩阵P的转置,τ代表较小的正数,I代表单位矩阵;求y的近似值过程,即为所述噪声类别识别模型的训练过程;将待识别声音片段输入训练完成的各所述噪声类别识别模型前,先将所述待识别声音片段转换为包含M+1*N个元素的行向量g;将g分别作为各所述噪声类别识别模型的输入,根据gyi=hi的关系,计算相应的模型输出hi;基于hi为一个包含两个元素的行向量,比较hi中两个元素的大小,若第一个元素更大且对应的置信度大于规定阈值,则当前的声音片段属于第i个类别,其中置信度定义为hi中第一元素与第二个元素的绝对值比值。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 智能识别环境噪声类别的方法、系统及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。