买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请提供了一种自适应语音增强的语音交互方法,该方法包括:获取用户输入的语音文件,并通过语音识别得到相应的文本文件;根据seq2seq端到端模型得到机器回复的文本文件;将机器回复的文本文件进行文本分析,并送入声学模型中进行训练,获取语音特征,通过声码器合成语音;获取伦巴第语音音频的德语语料库作为训练数据集,采用训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0;通过声压计实时获取当前环境噪声等级;将特征频谱包络MCCs特征和当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试,根据实时噪声等级进行相应的语音风格转换,并输出语音增强后的语音。
主权项:1.一种自适应语音增强的语音交互方法,其特征在于,所述方法包括:获取用户输入的语音文件,并通过语音识别得到相应的文本文件;根据seq2seq端到端模型对所述文本文件进行翻译,以得到机器回复的文本文件,其中,所述seq2seq端到端模型是根据THCHS-30中文数据库训练得到的;将所述机器回复的文本文件进行文本分析,并送入声学模型中进行训练,获取语音特征,通过声码器合成语音;获取包含正常语音音频与两个噪声等级下的伦巴第语音音频的德语语料库作为训练数据集,采用所述训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0;通过声压计实时获取当前环境噪声等级;将所述特征频谱包络MCCs特征和所述当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试,根据实时噪声等级进行相应的语音风格转换,并输出语音增强后的语音,计算自适应自注意StarGAN网络的损失函数;将语音可懂度、短时客观可懂度作为语音增强后的语音的可懂度以及感知效果的评价指标。
全文数据:
权利要求:
百度查询: 江汉大学 一种自适应语音增强的语音交互方法、系统及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。