买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:无锡雪浪数制科技有限公司
摘要:本申请提供了一种融合语义图的向量数据库问答处理方法、设备及存储介质,其中,该方法包括:根据多个原始文档构建向量数据库;根据向量数据库,构建语义数据库;对用户输入的待查询问题进行向量化处理,得到待查询向量;根据向量数据库中存储的第一数据,和或,语义数据库中存储的第二数据,检索得到待查询向量对应的答案文本;根据答案文本以及预先训练得到的大模型,生成待查询问题的目标答案。本申请在对用户输入的待查询问题进行检索时,可以从向量数据库和或语义数据库中检索得到对应的答案文本,提高得到答案文本过程中的灵活性,并且不再局限于关键词匹配与简单的语法分析,能够提高得到的答案文本的准确性。
主权项:1.一种融合语义图的向量数据库问答处理方法,其特征在于,包括:根据多个原始文档构建向量数据库,所述向量数据库中存储有第一数据,所述第一数据包括:多个原始文档的数据,各原始文档的数据包括:与所述原始文档的文本结构对应的多个答案向量以及各所述答案向量的位置信息,所述位置信息用于指示所述答案向量在所述原始文档中对应的位置;根据所述向量数据库,构建语义数据库,所述语义数据库中存储有第二数据,所述第二数据包括:所述向量数据库中各答案向量两两之间的相似度、各所述答案向量以及各所述答案向量的所述位置信息,所述语义图为所述语义数据库对应的语义图;对用户输入的待查询问题进行向量化处理,得到待查询向量;根据所述向量数据库中存储的所述第一数据,和或,所述语义数据库中存储的所述第二数据,检索得到所述待查询向量对应的答案文本;根据所述答案文本以及预先训练得到的大模型,生成待查询问题的目标答案;所述根据所述向量数据库中存储的所述第一数据,和或,所述语义数据库中存储的所述第二数据,检索得到所述待查询向量对应的答案文本,包括:根据所述向量数据库中存储的所述第一数据,从所述向量数据库中检索得到所述待查询向量对应的至少一个第一中间向量,并根据各所述第一中间向量的位置信息,确定与各所述第一中间向量位置相关的至少一个第二中间向量,将各所述第一中间向量以及各所述第二中间向量分别作为一个目标中间向量并加入目标中间向量集合中;根据所述待查询向量、所述目标中间向量集合以及所述语义数据库中存储的所述第二数据,从所述语义数据库中检索得到所述待查询向量对应的答案文本;所述根据各第一中间向量的位置信息,确定与各所述第一中间向量位置相关的至少一个第二中间向量,包括:确定所述第一中间向量在所述原始文档中的层级;根据所述第一中间向量在所述原始文档中的层级,确定与所述第一中间向量位置相关的至少一个第二中间向量,所述位置相关为所述第二中间向量与所述第一中间向量在原始文档的文本结构中为父节点或子节点的关系,或者所述第二中间向量与所述第一中间向量在原始文档的文本结构中存在相同的父节点或子节点的关系。
全文数据:
权利要求:
百度查询: 无锡雪浪数制科技有限公司 融合语义图的向量数据库问答处理方法、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。