买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请公开了一种基于大语言模型的交互式应答方法及系统,其响应于检测到用户确定与第一数字人对象进行交互的动作,生成交互窗口,且在所述交互窗口,接收由所述用户输入的交互语音信号,并采用基于人工智能的语音信号处理和识别技术对所述交互语音信号进行语音处理和文本语义编码,以此来基于所述交互语音信号的文本语义和情感波形语义的融合特征来智能地生成数字人交互文本并在所述交互窗口进行播放。通过这种方式,可以深入地理解用户的查询意图和上下文信息,同时能够识别用户的情绪状态,并据此调整回复的情感色彩,使交互过程更自然,以此提升整体的用户体验。
主权项:1.一种基于大语言模型的交互式应答方法,其特征在于,包括:响应于检测到用户确定与第一数字人对象进行交互的动作,生成交互窗口;在所述交互窗口,接收由所述用户输入的交互语音信号;对所述交互语音信号进行语音识别以得到交互语音文本识别结果;对所述交互语音文本识别结果进行语义编码以得到交互语音文本语义编码特征向量;对所述交互语音信号进行情感模式特征提取以得到交互语音情感模式波形语义表示向量;将所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量输入逐特征值粒度交互融合模块以得到交互文本语义-交互情感融合表示向量作为交互文本语义-交互情感融合表示特征;基于所述交互文本语义-交互情感融合表示特征,得到数字人交互文本并进行播放;其中,将所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量输入逐特征值粒度交互融合模块以得到交互文本语义-交互情感融合表示向量作为交互文本语义-交互情感融合表示特征,包括:基于所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量计算门限向量;以所述门限向量中各个位置的门限值,计算所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量的加权和以得到所述交互文本语义-交互情感融合表示向量;其中,基于所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量计算门限向量,包括:将所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量进行级联以得到交互语音级联特征向量;将所述交互语音级联特征向量首先与变换矩阵进行相乘后,再将得到的特征向量与偏置向量进行按位置相加,然后将得到的特征向量输入sigmoid激活函数以得到所述门限向量;其中,以所述门限向量中各个位置的门限值,计算所述交互语音文本语义编码特征向量和所述交互语音情感模式波形语义表示向量的加权和以得到所述交互文本语义-交互情感融合表示向量,包括:以所述交互语音文本语义编码特征向量中各个位置的特征值作为自然常数的指数以计算以自然常数为底的指数函数值与一减去相应的的门限值之间的乘积以得到由多个交互语音文本语义特征值组成的交互语音文本语义编码特征向量;以所述交互语音情感模式波形语义表示向量中各个位置的特征值作为自然常数的指数以计算以自然常数为底的指数函数值与相应的的门限值之间的乘积以得到由多个交互语音情感模式波形语义特征值组成的交互语音情感模式波形语义编码特征向量;将所述交互语音文本语义编码特征向量与所述交互语音情感模式波形语义编码特征向量进行按位置相加以得到所述交互文本语义-交互情感融合表示向量。
全文数据:
权利要求:
百度查询: 溯元文化科技有限公司 一种基于大语言模型的交互式应答方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。