Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于图卷积神经网络的语音关键词识别系统及方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏清微智能科技有限公司

摘要:本发明公开一种基于图卷积神经网络的语音关键词识别系统及方法,属于神经网络的轻量级、低功耗的语音关键词识别方法技术领域。包括:一个语音数据采集模块、一个带通滤波器、一个声学特征提取模块、一个神经网络分类器和一个基础网络结构。基于图卷积神经网络的语音关键词识别系统使用窄通道的bottleneck结构和残差连接的方式,在精度相当的情况下显著压缩了网络的复杂度,实现了高效的网络计算,更适用于低资源设备场景的应用。引入图卷积网络对卷积特征图全局上下文进行建模,提高了语音关键词识别准确率。本发明解决了现有技术中基于卷积神经网络的关键词识别方法网络复杂度还比较高和计算仍然比较密集和卷积神经网络难以提取全局信息的问题。

主权项:1.一种基于图卷积神经网络的语音关键词识别系统,其特征在于,包括:一个语音数据采集模块,通过语音数据采集模块采集操作人员发出的唤醒词;一个带通滤波器,其能够滤除接收所述语音数据采集模块唤醒词中的噪声;一个声学特征提取模块,其能够接收所述语音数据采集模块采集的唤醒词,通过声学特征提取模块提取唤醒词的特征信息;一个基础网络结构,其包括一个初始区组、若干个stage和一个神经网络分类器;若干个所述stage通过不同数目的bottelneckblock组成;所述bottelneckblock的数目根据模型的复杂度调整;所述神经网络分类器包括全局池化层、线性层和Softmax模块;所述初始区组具有一层不带偏置的3*3的卷积;所述bottelneckblock包括三层卷积,第一层卷积和第三层卷积是1*1卷积,第二层卷积是3*3卷积;若干个所述stage通过不同数目的bottelneckblock组成,所述bottelneckblock的数目根据模型的复杂度调整;一个图卷积神经网络模块,其插入所述基础网络结构;所述图卷积神经网络模块能够通过图卷积神经网络对全局的上下信息建模;所述不带偏置的3*3的卷积层能够从MFCC特征中提取特征表示,将单通道的Fbank特征转换为多通道的卷积特征图;Ratio表示降维的比例,所述Ratio小于1,所述小于1的Ratio能够起到压缩网络参数和计算量的效果;若干个stage包括:第一模块、第二模块以及第三模块,其中所述第一模块的Ratio=0.5,所述第二模块、所述第三模块的Ratio为0.25。

全文数据:

权利要求:

百度查询: 江苏清微智能科技有限公司 一种基于图卷积神经网络的语音关键词识别系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。