买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江工业大学
摘要:本发明公开一种基于业务关键信息引导的检索增强生成方法。首先利用大模型对用户的问题进行改写和重构,将其转写成包含原始问题语义信息和对应业务关键信息的新问题;然后用新的问题去定位到相关文档页面,并采用视觉化驱动的方式对相关文档页面进行文本分块;在此基础上,利用向量检索工具对用户问题和分块后的文本进行检索;最后选择检索到的前K个最相关文本块作为提示输入,供大模型生成最终答案。本发明的文本分块方式保留了原始文档的语义结构,而且利用业务关键信息定位相关文档页面的方式缩小了检索的范围,从而提高了文档的召回率。本发明可为真实场景中的检索增强生成任务提供有价值的参考。
主权项:1.一种基于业务关键信息引导的检索增强生成方法,其特征在于,包括以下步骤:S1:问题转写:根据文档目录中出现的业务关键词设计提示模板,通过设计好的提示模板结合原始用户问题输入到大模型中对问题进行转写;S2:定位相关页面:读取文档,根据文档中出现的标题提取出每个标题对应的页码范围,然后根据所述步骤S1准备好的转写后的问题匹配到相关页面;S3:文本分块:通过所述步骤S2准备好的相关页码范围读取相应文档页面,再结合文档分块工具对文本进行分块;S4:向量表示:通过所述步骤S3分块好的文本和用户原始问题,利用文本嵌入模型进行编码;S5:相似检索:将所述步骤S3和步骤S4编码好的文本块和编码好的用户原始问题输入大模型,利用向量数据库建立索引,然后利用文本检索工具进行检索;S6:大模型输出:结合用户原始问题和步骤S5得到的最相关的文本块设计提示模板,最后利用大模型进行最终输出。
全文数据:
权利要求:
百度查询: 浙江工业大学 一种基于业务关键信息引导的检索增强生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。