买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:青岛珞宾通信有限公司
摘要:本发明公开了一种基于PDA端边缘计算处理的声音识别方法,涉及声音识别领域,包括:录音得到多段环境噪声信号序列;计算得到噪声平均功率谱;录音得到语音信号序列;计算语音功率谱,并根据噪声平均功率谱,对语音功率谱进行降噪处理;计算得到多卷积融合特征序列;计算多卷积融合特征序列与各个词句标准序列的相似度,识别出用户所说词句。本发明通过无云端处理的边缘计算,快速、高效且安全地识别用户声音,解决了现有声音识别方法依赖于云计算资源,网络依赖性强、响应时间长、隐私泄露风险的问题。
主权项:1.一种基于PDA端边缘计算处理的声音识别方法,其特征在于,包括以下步骤:S1、在用户未说话时,通过PDA的内置麦克风多次录音,得到多段环境噪声信号序列;S2、根据各段环境噪声信号序列,计算得到噪声平均功率谱;S3、在用户说话时,通过PDA的内置麦克风录音,得到语音信号序列;S4、根据语音信号序列,计算语音功率谱,并根据噪声平均功率谱,对语音功率谱进行降噪处理;S5、根据降噪后的语音功率谱,计算得到多卷积融合特征序列;S6、计算多卷积融合特征序列与各个词句标准序列的相似度,识别出用户所说词句;所述S5包括以下分步骤:S51、将降噪后的语音功率谱,分别与第一矩形窗、第二矩形窗和第三矩形窗进行卷积运算,得到第一尺度特征序列、第二尺度谱特征序列和第三尺度谱特征序列;S52、通过下式,对降噪后的语音功率谱、第一尺度谱特征、第二尺度谱特征和第三尺度谱特征进行加权求和,得到多卷积融合特征序列: ,其中,rk为多卷积融合特征序列的第k元素值,r1k为第一尺度特征序列的第k元素值,r2k为第二尺度特征序列的第k元素值,r3k为第三尺度特征序列的第k元素值,α0为零号加权系数,α1为一号权系数,α2为二号加权系数,α3为三号加权系数。
全文数据:
权利要求:
百度查询: 青岛珞宾通信有限公司 一种基于PDA端边缘计算处理的声音识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。