买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:一种自适应多频段语音混合情感感知方法,输入语音信号经过预处理分帧,利用快速傅里叶变换获取频谱特征,信号通过梅尔尺度的三角滤波器组处理,模拟人类听觉系统的非线性频率特性,并通过离散余弦变换提取关键频率信息的梅尔频谱系数。根据语音共振峰F1、F2、F3进行频段划分,定制化特征提取策略。自适应深度残差块并行处理各频段特征,深度控制器动态调整网络深度以适应信号复杂度。ADRB中,多层蒸馏和残差通道实现多级特征提取,残差连接优化特征融合。混合区域注意力机制结合全局和局部注意力,强化频段间依赖关系。时间驱动模块加强时序连续性,最终特征融合用于情感分类和识别。该方法全面捕捉情感特征,显著提升情感状态识别的精度和效率。
主权项:1.一种自适应多频段语音混合情感感知方法,其特征在于,包括以下步骤:S1.对输入信号进行预处理,对信号进行分帧;S2.对每帧信号执行快速傅里叶变换FFT,获得频谱特征;S3.应用梅尔尺度的三角滤波器组对频谱进行处理,模拟人类听觉系统的非线性频率特性;S4.通过离散余弦变换对滤波后的频谱进行处理,提取每帧的多个梅尔频谱系数,捕捉信号的关键频率信息;S5.根据语音信号的共振峰F1、F2和F3将信号划分为不同的频段,为每个频段定制特征提取策略;S6.对各频段应用自适应深度残差块ADRB,进行并行的多维特征提取和整合;S7.使用深度控制器NSDR动态预测每个频段的最佳网络深度,根据输入信号的复杂度自适应调整网络结构;S8.在自适应深度残差块ADRB中,由深度控制器动态控制卷积层数,通过多层蒸馏通道和残差通道实现多级特征提取,利用残差连接进行特征融合;S9.应用混合区域注意力机制HRFA,结合全局和局部注意力机制,强化不同频段特征之间的长距和短距依赖关系,其中全局注意力机制通过多头注意力架构捕获全频域上下文信息,局部注意力机制于每个频率周围的相邻区域进行细粒度分析;S10.通过时间驱动模块强化时间序列上不同频率特征的相关连续性,处理时间正序和逆序,捕捉长时间依赖关系;S11.将经过多频段处理、混合区域注意力机制增强和时间驱动模块提取的特征进行融合;S12.利用融合后的特征进行情感状态的分类和识别。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 一种自适应多频段语音混合情感感知方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。