首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种智能化语音交互方法、系统、介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:博洛尼智能科技(青岛)有限公司

摘要:本申请涉及语音处理技术领域,具体涉及一种智能化语音交互方法、系统、介质,该方法包括:获取麦克风阵列中所有阵元的语音信号,对语音信号进行分帧;根据语音信号在时域、频域上的信号特征,获取时域干扰评估值、频域干扰评估值;构建发声干扰系数;基于阵元之间的距离,对语音信号之间的相似程度进行分析,获取声波方向系数;结合所述发声干扰系数,构建声纹可信度;获取各阵元各音频帧的自适应静态权重,结合波束形成算法,获取用于交互的合成语音信号。本申请对每个麦克风阵元附加相应的静态权重,提高合成语音信号质量,进而提高语音交互的识别准确度。

主权项:1.一种智能化语音交互方法,其特征在于,该方法包括以下步骤:获取麦克风阵列中所有阵元的语音信号;对各阵元的语音信号分帧,获取各音频帧;根据各音频帧在时域上的信号特征,获取各音频帧的时域干扰评估值;根据各音频帧在频域上的信号特征,获取各音频帧的频域干扰评估值;基于各阵元内各音频帧的时域干扰评估值以及频域干扰评估值,获取各阵元内各音频帧的发声干扰系数;基于各阵元与其余阵元的距离关系,对音频帧之间的相似程度进行比较,获取各阵元内各音频帧的声波方向系数;基于各阵元内各音频帧的发声干扰系数以及声波方向系数,获取各阵元内各音频帧的声纹可信度;基于各阵元相同位置音频帧的声纹可信度的分布,获取各阵元各音频帧的自适应静态权重;基于所有阵元所有音频帧的自适应静态权重,结合波束形成算法,获取用于交互的合成语音信号;所述根据各音频帧在时域上的信号特征,获取各音频帧的时域干扰评估值,具体为:对于各阵元内各音频帧,将各音频帧对应的语音信号作为各音频的语音序列;对各音频帧的语音序列进行拟合,获取各音频曲线;获取各音频点的语音序列与对应音频曲线的所有相同位置数据的差异的离散程度;获取各音频曲线的可决系数;将各音频所述离散程度与可决系数的反向融合作为各音频帧的时域干扰评估值;所述根据各音频帧在频域上的信号特征,获取各音频帧的频域干扰评估值,具体为:获取各音频帧通过频域响应中频率分量的数量以及能量最大的频率分量;将能量最大的频率分量称为基频;将基频对应包络面积占总频域对应包络面积的比值作为基频能量占比;将频率分量的数量与所述基频能量占比的反向关系作为频域干扰评估值;所述声纹可信度具体为所述声波方向系数与所述发声干扰系数的比值;所述基于所有阵元所有音频帧的自适应静态权重,结合波束形成算法,获取用于交互的合成语音信号,包括:将所有阵元的语音信号作为波束形成算法的输入,将各阵元各音频帧的自适应静态权重作为GSC波束形成算法中各音频帧下主通道每个阵元对应的自适应静态权重,GSC波束形成算法的输出为用于交互的合成语音信号。

全文数据:

权利要求:

百度查询: 博洛尼智能科技(青岛)有限公司 一种智能化语音交互方法、系统、介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。