买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开一种基于大语言模型的大坝应急响应规则问答推荐系统及其构建方法,对于用户上传的应急响应文档编码后构建相应知识库;对于用户输入进行攻击性倾向检验;对用户输入进行应急场景识别与提问关键词提取;根据应急场景与提问关键词对知识库中的应急响应规则匹配;将应急响应规则文本整合入提示词模板中并输出结果。本发明用于大坝应急响应规则问答,根据大坝应急响应知识库的相关专业领域知识与预料为大语言模型提供了相关信息,帮助模型更好地理解问题,提高回答的准确性和全面性,增强大坝应急响应规则问答系统的表现。
主权项:1.一种基于大语言模型的大坝应急响应规则问答推荐系统构建方法,其特征在于,包括以下步骤:1应急响应文档编码:大坝应急响应规则问答推荐系统对用户上传的应急响应文档进行处理,对原始文档执行格式标准化处理,通过文本预处理与文本分割,将文档拆分为文段,使用语义向量模型将划分后的文段编码为向量形式以捕捉语义信息,此后这一向量表示被存储于向量数据库中,用于向量相似度检索计算;2用户输入检验:构建文本合规性分类模型,识别和过滤用户输入,对用户输入的内容进行审核,通过文本合规性分类模型输出结果综合判断用户输入是否包含违规内容,对于非法提问进行过滤;3用户输入场景识别与关键词提取:构建应急响应场景分类模型,从设定的应急响应场景库中识别用户提问对应的应急场景,用于关系数据库中进行应急响应场景的定;构建关键词提取模型,对于合法的用户提问输入提取关键词,挖掘提问中的关键信息;对于抽取到的关键信息,利用语义向量模型将其编码为向量形式,用于向量数据库中进行相似度计算并检索;4应急响应规则匹配:构建应急响应规则匹配模型,利用提取到的应急场景与用户提问关键词,根据关键词计算语义相似度,从向量数据库中查询匹配语义相似度最高的前k条应急响应规则的标识号,根据标识与应急场景,从关系数据库中查询符合应急场景的应急响应规则的文本内容;5整合提示词并输出结果:构建提示词模板库,根据应急场景需求,选择不同的提示词模板,在接收到向量数据库的查询结果后,根据提示词模板要求将应急响应规则作为补充知识整合进提示模板中;设置预防措施,防止用户利用提问输入进行提示词注入攻击;整合完毕的提示词将被最终输入到大语言模型中进行处理,系统随后将大模型的输出结果反馈给用户最为最终输出;所述步骤1中应急响应文档编码的具体步骤如下:1.1文档标准化处理:给定输入文档以及对应应急场景,对文档进行标准化处理,使用文档加载器将输入文档转换为纯文本数据;1.2文档切片:将文档进行文档切片,将长文本分割成多个短文本文段{p1,p2,...,pm},其中每个文段pi都包含原始长文本的一部分完整语义;1.3文段编码成向量形式:对于分割后的短文本文段{p1,p2,...,pm},借助预训练的向量编码模型捕捉文段深层次的语义关系,得到以数字形式表示的语义向量如以下公式所示: 其中,Embed·为向量编码模型;1.4信息储存至数据库:每个生成的语义向量及其对应文段pi被分配一个唯一的标识符,语义向量被存储至向量数据库中,文本以及应急场景被存储至关系数据库中,以进行相似度计算与应急响应规则匹配所述步骤3中的用户输入场景识别与关键词提取的具体步骤如下:3.1应急场景识别:对于用户输入q,使用应急场景分类模型识别用户提问对应的应急场景s∈S,其中S为应急场景库;3.2提问关键词提取:对于用户输入q,使用关键词提取模型识别用户提问包含的关键词{k1,k2,...,km},借助预训练的向量编码模型对关键词进行编码,得到以数字形式表示的语义向量如以下公式所示: 其中,Embed·为向量编码模型;所述步骤4中的应急响应规则匹配的具体步骤如下:4.1相似度计算;给定用户提问关键词的语义向量从向量数据库中存储的规则文本的语义向量集中计算每一条规则文本的语义向量与用户输入q之间的相似度si,即应急响应规则文本向量与用户输入关键词向量的匹配分数,如以下公式所示: 其中,Similarity·为二者之间的相似度得分函数,这里使用余弦相似度用于比较二者的相似程度,为关键词平均语义向量,如以下公式所示: 4.2数据库查询:根据用户设定的匹配条数选择计算得到的相似度得分{s1,s2,...,sm}最高的前k条的标识号;根据标识号与识别的应急场景s从关系数据库中查询对应的匹配应急响应规则文本所述步骤5中的整合提示词并输出结果的具体步骤如下:5.1从提示词模板库中选择模板:根据应急场景的不同,从预设的提示词模板库中选择该应急场景对应的提示词模板,其中每个提示词模板已以占位符的形式预留了应急响应规则文本的空间;5.2进行提示词防注入设置:在提示词模板中设置系统消息,规定大语言模型的角色与功能范围,设定系统消息与用户消息的分隔符;过滤用户输入中的设定的特定分隔符,防止用户进行提示词注入;在用户输入前添加前缀消息,要求大语言模型严格按照系统消息的要求输出回复;5.3注入应急响应规则:将查询得到的k条应急响应规则文本与提示词模板中的占位符进行匹配,将每一条应急响应规则文本格式化后根据模板要求整合到提示词模板中作为最终交给大语言模型的提示词输入。
全文数据:
权利要求:
百度查询: 河海大学 华能澜沧江水电股份有限公司 基于大语言模型的大坝应急响应规则问答推荐系统构建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。