买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市智创一切科技有限公司
摘要:本申请公开了一种用于语音编码的蓝牙音频的传送方法、系统和电子设备,其通过使用作为基于语义理解模型的预测编码模型的编码器‑掩码器结构,可以通过对发送端的语音数字信号进行编码来得到接收端的语音数字信号,从而通过编码器‑解码器模型来并入通信环境因素,另外,利用上述编码器‑掩码器结构中的语义理解模型的用于掩码预测的变换器机制,可以基于语音数字信号的整体对语音数字信号的模型进行标注,从而体现出音频的模式。这样在编码时,除了考虑到音频模式外,还结合了通信环境的表征,以提高编码的精度。
主权项:1.一种用于语音编码的蓝牙音频的传送方法,其特征在于,包括:训练阶段,包括:获取训练数据集,所述训练数据集包括发送端发送的语音信号和真实的接收端接收到的语音信号;将所述训练数据集中的所述发送端发送的语音信号通过作为预测编码模型的语义理解模型以获得多个语音特征向量,其中,所述多个语音特征向量中每个语音特征向量对应于所述发送端发送的语音信号中的一段语音信号;将所述多个语音特征向量输入由多个全连接层组成的解码器模型以从所述多个语音特征向量组成的语音特征向量序列中恢复出解码语音信号;通过最小化所述解码语音信号和所述真实的接收端接收到的语音信号之间的差异来训练所述预测编码模型和所述解码器模型;将所述多个语音特征向量分别通过所述预测编码模型的转换器以获得多个编码的语音特征向量;基于所述转换器的内在结构,计算所述多个编码的语音特征向量中每个编码的语音特征向量的掩码转换值以获得由多个掩码转换值组成的分类特征向量,其中,所述掩码转换值基于所述多个编码的语音特征向量中两个编码的语音特征向量之间的距离和所述多个编码的语音特征向量中各个编码的语音特征向量是否被编码的表征值计算而得;将所述分类特征向量通过多标签分类器来标注所述分类特征向量的类别,其中,所述分类特征向量的类别用于表示所述多个编码的语音特征向量作为整体的类别;以及基于所述分类特征向量的类别与真实类别之间的交叉熵损失函数值来训练所述预测编码模型的转换器和所述多标签分类器;以及推断阶段,包括:获取发送端发送的语音信号;将所述发送端发送的语音信号输入经训练阶段训练完成的所述预测编码模型和所述多标签分类器以获得多个语音特征向量和所述发送端发送的语音信号对应的类别;以及将所述多个语音特征向量和所述发送端发送的语音信号对应的类别发送至接收端。
全文数据:
权利要求:
百度查询: 深圳市智创一切科技有限公司 用于语音编码的蓝牙音频的传送方法、系统和电子设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。