一种自适应语音增强的语音交互方法、系统及存储介质

导航：龙图腾网> 最新专利技术> 一种自适应语音增强的语音交互方法、系统及存储介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请提供了一种自适应语音增强的语音交互方法，该方法包括：获取用户输入的语音文件，并通过语音识别得到相应的文本文件；根据seq2seq端到端模型得到机器回复的文本文件；将机器回复的文本文件进行文本分析，并送入声学模型中进行训练，获取语音特征，通过声码器合成语音；获取伦巴第语音音频的德语语料库作为训练数据集，采用训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0；通过声压计实时获取当前环境噪声等级；将特征频谱包络MCCs特征和当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试，根据实时噪声等级进行相应的语音风格转换，并输出语音增强后的语音。

主权项：1.一种自适应语音增强的语音交互方法，其特征在于，所述方法包括：获取用户输入的语音文件，并通过语音识别得到相应的文本文件；根据seq2seq端到端模型对所述文本文件进行翻译，以得到机器回复的文本文件，其中，所述seq2seq端到端模型是根据THCHS-30中文数据库训练得到的；将所述机器回复的文本文件进行文本分析，并送入声学模型中进行训练，获取语音特征，通过声码器合成语音；获取包含正常语音音频与两个噪声等级下的伦巴第语音音频的德语语料库作为训练数据集，采用所述训练数据集通过声码器提取出语音中的特征频谱包络MCCs和基频f0；通过声压计实时获取当前环境噪声等级；将所述特征频谱包络MCCs特征和所述当前环境噪声等级输入噪声自适应自注意StarGAN网络模型中进行模型的测试，根据实时噪声等级进行相应的语音风格转换，并输出语音增强后的语音，计算自适应自注意StarGAN网络的损失函数；将语音可懂度、短时客观可懂度作为语音增强后的语音的可懂度以及感知效果的评价指标。

全文数据：

权利要求：

百度查询：江汉大学一种自适应语音增强的语音交互方法、系统及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于SONiC操作系统的可插拔设备管理方法和装置

下一篇：一种平面距离测量机构

相关技术

一种基于SONiC操作系统的可插拔设备管理方法和装置

一种平面距离测量机构

一种铂-二氧化铈催化剂、其制备方法及其应用

出水装置

一种有机电致发光驱动电路故障诊断优化方法

基于时空数字底座的多源数据同步更新系统

数据处理方法、计算机设备、存储介质和程序产品

一种水利工程水渠格栅控制系统及控制方法

一种药物球囊扩张导管和介入式医疗器械

数字化项目评审数据服务平台建立方法

一种定子冲片收料装置

一种具有气体发生器的冷柜

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种自适应语音增强的语音交互方法、系统及存储介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务