首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于知识图谱与大语言模型的智能客服问答方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州昊清科技有限公司;浙江中正智能科技有限公司;信雅达科技股份有限公司

摘要:本发明公开了一种基于知识图谱与大语言模型的智能客服问答方法,包括:步骤1:将客户问题作为查询文本进行意图识别,判断客户问题对应的行业;步骤2:在对应行业的知识库中,搜索客户查询文本相关的专业知识,并将专业知识和客户查询文本同时输入大语言模型,生成初步答案;步骤3:使用大语言模型对生成的初步答案进行三元组抽取,将抽取出的三元组与构建的行业知识图谱进行匹配;步骤4:将知识图谱中匹配到的相关实体数据再次输入到大语言模型,基于客户查询文本进行二次回答,得到最终答案。本发明实现了精准答案提取与自动生成,极大提升了问答的准确性、专业性和交互的自然流畅性;并且,通过二次回答,提高了回答的准确性和专业性。

主权项:1.一种基于知识图谱与大语言模型的智能客服问答方法,其特征在于包括如下步骤:步骤1:将客户问题作为查询文本进行意图识别,判断客户问题对应的行业;步骤2:在对应行业的知识库中,搜索客户查询文本相关的专业知识,并将专业知识和客户查询文本同时输入大语言模型,生成初步答案;步骤3:使用大语言模型对生成的初步答案进行三元组抽取,将抽取出的三元组与构建的行业知识图谱进行匹配;行业知识图谱构建中,命名实体识别的过程包括如下步骤:步骤3.1:对行业数据进行预处理;步骤3.2:对预处理的数据进行编码;采用四层嵌入从不同层面对行业数据文本进行编码;通过标记嵌入,将行业数据中的离散词语转换为连续的向量空间,捕捉词语之间的语义相似性,并为每个词提供一个基础表示;通过标记嵌入将行业文本xi映射为实数向量ei;ei=Qtokenonehotxi式中,Qtoken表示固定大小的词嵌入矩阵,onehot.为one-hot编码函数,行业文本序列为x={x1,x2,……,xn},其中n输入序列长度,xi表示序列重地i个字,i=1,2,···,n;通过位置嵌入,编码词语在句子或文本中的位置信息,使模型区分不同位置上的词语,并捕捉词语之间的相对距离;位置嵌入为每个字xi的位置编码固定大小的向量pi: 式中,k表示维度索引,l表示字符嵌入的维度;通过句子嵌入,将词嵌入或词级别的表示进行组合,捕捉句子的语义和上下文信息;句子嵌入对标记嵌入和位置嵌入输出进行加权平均计算,得到整个句子的向量表示s: 式中,W1,W2分别表示标记嵌入、位置嵌入的权重矩阵;通过任务嵌入,引入任务相关的嵌入向量,将模型的注意力和重点放在当前任务上,使模型学习任务特定的信息和模式;通过梯度下降学习到任务嵌入并输入编码器中,计算输入序列与其他位置的注意力分数αi: 式中,d表示注意力机制的维度;qi表示经过线性变换后得到的查询向量;对αi进行加权平均,计算相应位置的输入向量zi: 式中,u表示词向量个数,vj表示第j个词向量线性变换结果;全连接计算;通过前馈神经网络对每个位置的输出向量进行全连接,得到最终输出向量Ti:Ti=ReLUziw1+b1w2+b2式中,ReLU表示激活函数;w1、w2表示训练权重,b1、b2表示偏置;步骤3.3:引入字库数据并进行编码;步骤3.4:基于门控循环单元的联合编码;使行业数据编码后的向量与字库编码后的向量维度统一,以获取两种编码的字符表示,在联合编码时,先用门控循环单元对标准化的向量进行定长处理并横向拼接,再对序列数据进行处理,融合关键特征并生成联合编码表示;步骤3.5:将门控循环单元输出的字符序列作为长短期记忆模型的输入序列,提取行业数据的实体;步骤4:将知识图谱中匹配到的相关实体数据再次输入到大语言模型,基于客户查询文本进行二次回答,得到最终答案。

全文数据:

权利要求:

百度查询: 杭州昊清科技有限公司 浙江中正智能科技有限公司 信雅达科技股份有限公司 一种基于知识图谱与大语言模型的智能客服问答方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。