买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东浪潮科学研究院有限公司
摘要:本申请涉及自然语言处理技术领域,公开了一种提升大语言模型在RAG框架下输出准确率的方法及装置,该方法涵盖多个环节:先对上传的多种格式文档进行版面分析、内容提取与分段处理,捕捉每段关键信息;随后,对这些分段进行向量化操作,连同对应权重存储于向量库。接下来,利用大模型为分段生成相关问题,并按结构分类储存。在用户提问时,系统根据关键词推荐问题,并执行关键词和向量双重搜索,最后合并、过滤搜索结果。基于这些优选素材,大模型将生成并返回精准答案。这一创新方法显著提高了大语言模型在RAG框架下的性能,有效减少了幻觉现象,为用户提供了更准确、更可靠的回答。
主权项:1.一种提升大语言模型在RAG框架下输出准确率的方法,其特征在于,包括:1文档摄取与分段:支持上传多种格式的文档,并利用特定模型对文档进行版面分析和内容提取,将文档内容分段,并保留每段的关键信息;2向量化操作与存储:对每个分段进行向量化处理,并将向量及对应权重存储于向量库中;3相关问题库生成:将整理后的分段送入大模型生成相关问题,并按照一定结构分类存储;4意图理解与多重搜索:在用户提问时,根据关键词实时推荐问题,并在问题获取后,进行包括关键词搜索和向量搜索的多重搜索,最终合并搜索结果进行过滤;5答案生成:基于筛选出的素材,通过大模型生成并返回答案。
全文数据:
权利要求:
百度查询: 山东浪潮科学研究院有限公司 提升大语言模型在RAG框架下输出准确率的方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。