买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本申请涉及人工智能技术领域,具体提供了一种基于语音的年龄识别方法、装置、设备及存储介质,其中,该方法包括:基于用户的样本语音得到待识别语音数据;通过深度学习神经网络对待识别语音数据进行特征提取,得到包括话语内容、音调、情感、用户个性、性别和年龄的特征矩阵,并基于特征矩阵得到包括用户的年龄的预测分布;根据预测分布和待识别语音数据的标签分布,计算得到混合损失函数值;根据混合损失函数值对年龄识别模型进行迭代更新。本申请实施例有利于提升说话者年龄识别的精度。
主权项:1.一种基于语音的年龄识别方法,其特征在于,所述方法包括:基于用户的样本语音得到待识别语音数据;通过深度学习神经网络对所述待识别语音数据进行特征提取,得到包括话语内容、音调、情感、用户个性、性别和年龄的特征矩阵,并基于所述特征矩阵得到包括用户的年龄的预测分布;根据所述预测分布和所述待识别语音数据的标签分布,计算得到混合损失函数值;根据所述混合损失函数值对所述深度学习神经网络进行迭代更新,得到训练好的年龄识别模型;所述根据所述预测分布和所述待识别语音数据的标签分布,计算得到混合损失函数值,包括:根据所述预测分布和所述标签分布,计算得到JS散度、方差损失和L1损失;根据所述JS散度、所述方差损失和所述L1损失及对应的惩罚系数,计算得到所述混合损失函数值;在根据所述预测分布和所述待识别语音数据的标签分布,计算得到混合损失函数值之前,所述方法还包括:获取所述待识别语音数据在话语内容维度上的标签概率、音调维度上的标签概率、情感维度上的标签概率、用户个性维度上的标签概率、性别维度上的标签概率和年龄维度上的标签概率;将所述待识别语音数据在话语内容维度上的标签概率、音调维度上的标签概率、情感维度上的标签概率、用户个性维度上的标签概率、性别维度上的标签概率和年龄维度上的标签概率组成所述标签分布;所述待识别语音数据在情感维度标签上的概率的获取步骤,包括:将所述待识别语音数据转换为待处理文本;对所述待处理文本中的单词进行屏蔽,得到屏蔽后的文本,以及采用词库中的任意单词对所述待处理文本中的单词进行替换,得到替换后的文本;基于所述屏蔽后的文本和所述替换后的文本,计算得到所述待处理文本中的单词对于所述待处理文本情感分类的重要性度量;将所述重要性度量归一化到预设区间,得到所述待识别语音数据在情感维度标签上的概率。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 基于语音的年龄识别方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。