恭喜杭州芝兰健康有限公司高云龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州芝兰健康有限公司申请的专利一种基于语音识别的情绪识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119479704B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510064919.5,技术领域涉及:G10L25/63;该发明授权一种基于语音识别的情绪识别方法是由高云龙;胡炜;马文越;程露红设计研发完成,并于2025-01-15向国家知识产权局提交的专利申请。
本一种基于语音识别的情绪识别方法在说明书摘要公布了:本发明公开了一种基于语音识别的情绪识别方法,属于语音处理技术领域。本发明设置3种不同长度的观察窗口在待识别的语音信号上滑动,以获取3种发音段集合。在发音段集合中计算每个时刻的发音能量值,构建发音能量向量。根据发音能量向量与日常平均发音能量值的比值,计算发音能量强度值,形成发音强度权值向量。提取每个时刻的发音谱频持续值,构建发音谱频权值向量。采用双通道特征增强模块对发音能量向量进行特征提取,并结合发音谱频权值向量和发音强度权值向量进行特征增强,最终得到语音情绪特征。最后,利用分类器对3种语音情绪特征进行分类处理,以识别情绪类型。本方法通过多维特征提取和增强,显著提高了情绪识别的准确性。
本发明授权一种基于语音识别的情绪识别方法在权利要求书中公布了:1.一种基于语音识别的情绪识别方法,其特征在于,包括以下步骤:S1、设置3种不同长度的观察窗口分别在待情绪识别语音信号上滑动,得到3种发音段集合;S2、在同1种发音段集合中,对每时刻发音段计算发音能量值,构建发音能量向量;所述S2中发音能量值的计算公式为:,其中,Ei为第i时刻发音段的发音能量值,Fi,j为第i时刻发音段的第j个采样点的幅值,Fi,m为第i时刻发音段中第m个局部最大幅值,i、j和m为正整数,N为发音段中采样点的数量,M为发音段中局部最大幅值的数量;S3、根据发音能量向量中各个发音能量值与待识别人日常平均发音能量值的比值,计算发音能量强度值,构建发音强度权值向量;S4、在同1种发音段集合中,对每时刻发音段提取发音谱频持续值,构建发音谱频权值向量;所述S4包括以下分步骤:S41、在同1种发音段集合中,对每时刻发音段进行傅里叶变换,得到发音频谱信息;S42、对发音频谱信息计算平均幅值,计算大于平均幅值的谱频率特征值;S43、计算i时刻与i+1时刻的谱频率特征值的差距,在差距大于差距阈值,将i时刻与i+1时刻之间标记为断点,其中,i为正整数;S44、根据各个断点,将各个谱频率特征值进行分段,得到多个谱频率特征值序列;S45、在每个谱频率特征值序列中,对每个谱频率特征值计算发音谱频持续值;S46、将每个发音谱频持续值作为元素,构建发音谱频权值向量;所述S45中计算发音谱频持续值的公式为:,其中,μi为第i时刻发音谱频持续值,D为归一化常数,T为观察窗口的长度,Ri为第i时刻的谱频率特征值所在的谱频率特征值序列中谱频率特征值的数量;S5、采用双通道特征增强模块对发音能量向量提取发音能量特征,并采用同1种发音段集合对应的发音谱频权值向量和发音强度权值向量进行特征增强,得到语音情绪特征;S6、采用分类器对3种语音情绪特征进行分类处理,得到情绪类型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州芝兰健康有限公司,其通讯地址为:310000 浙江省杭州市滨江区西兴街道聚工路19号8幢16层1601室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。