买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:谷歌有限责任公司
摘要:本申请涉及使用自回归生成神经网络来生成音频。用于生成音频信号的预测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。方法中的一种方法包括:接收生成音频信号的请求;获得音频信号的语义表示;使用一个或多个生成神经网络以至少语义表示为条件来生成音频信号的声学表示;以及使用解码器神经网络来处理至少声学表示以生成音频信号的预测。
主权项:1.一种用于生成音频信号的预测的计算机实现的方法,所述方法包括:接收以输入为条件来生成音频信号的请求,所述音频信号具有在跨越时间窗口的多个输出时间步长中的每个输出时间步长处的相应音频样本;使用嵌入神经网络来处理所述输入以将所述输入映射到一个或多个嵌入词元;生成所述音频信号的语义表示,所述语义表示指定在跨越所述时间窗口的多个第一时间步长中的每个第一时间步长处的相应语义词元,每个语义词元是以所述嵌入词元为条件从语义词元词表中选择的并且表示所述音频信号在对应第一时间步长处的语义内容;使用一个或多个生成神经网络以至少所述语义表示和所述嵌入词元为条件来生成所述音频信号的声学表示,所述声学表示指定在跨越所述时间窗口的多个第二时间步长中的每个第二时间步长处的一个或多个相应声学词元的集合,每个第二时间步长处的所述一个或多个相应声学词元表示所述音频信号在对应的第二时间步长处的声学特性;以及使用解码器神经网络来处理至少所述声学表示以生成所述音频信号的所述预测。
全文数据:
权利要求:
百度查询: 谷歌有限责任公司 使用自回归生成神经网络来生成音频
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。