买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖南汇视威智能科技有限公司
摘要:本申请公开了一种基于大语言模型算法的知识抽取系统以及知识抽取方法,其中,基于大语言模型算法的知识抽取系统包括数据收集与清洗模块、实体与关系抽取模块、实体消歧与对齐模块、知识存储模块,分别设置在数据收集层、数据过滤层、知识抽取层、知识消岐层与知识存储层,用于实现知识抽取,动态地评估在知识抽取过程中对外部知识库的实际需求,可以提高知识抽取的效率,输出更高质量的抽取结果。
主权项:1.一种基于大语言模型算法的知识抽取系统,其特征在于,可用于医疗健康领域,至少能够实现从医疗文献、病历记录和临床试验数据中进行知识抽取,以支持临床决策、研究和政策制定;所述知识抽取系统包括依次设置的数据收集层、数据过滤层、知识抽取层、知识消岐层与知识存储层,以供输入至所述知识抽取系统的数据依次经过,还包括:数据收集与清洗模块,用于对来自候选数据库中的不同数据源的异构数据进行收集和融合、处理,以获取处理后数据,且所述数据收集与清洗模块设置于所述数据收集层和数据过滤层;实体与关系抽取模块,连接至所述数据收集与清洗模块,用于基于所述大语言模型算法,从所述处理后数据中抽取所述处理后数据的实体与关系,并基于所述实体的复杂度,确定是否要在候选数据库中引入外部知识库,并获取所述处理后数据的知识三元组,所述实体与关系抽取模块设置于所述知识抽取层;实体消歧与对齐模块,连接至所述实体与关系抽取模块,用于获取所述实体中的照应语实体,并消除所述照应语实体的歧义,以及用于进行实体预对齐,所述实体消歧与对齐模块设置于所述知识消岐层;知识存储模块,连接至所述实体消歧与对齐模块,用于根据所述实体与关系构建本体模型,并用于将消岐与对齐后的知识三元组映射到所述本体模型中,并以知识图谱的形式组织和存储所述知识三元组,并用于对所述知识三元组进行语义匹配和相似度计算,从而输出匹配的知识表示形式,所述知识存储模块设置于所述知识存储层;所述实体与关系抽取模块进行实体抽取时,包括以下步骤:思考所述外部知识库的必要性、按需并行匹配所述外部知识库、反思所述外部知识库与待进行知识抽取的原始数据的相关性、基于相关性分数过滤所述外部知识库、构建提示并嵌入到所述待进行知识抽取的原始数据;所述实体与关系抽取模块包括实体抽取模块与关系抽取模块,其中:所述实体抽取模块用于从所述处理后数据中获取实体,所述实体包括特定语义信息,并基于大语言模型算法识别字符串的信息;所述关系抽取模块用于基于所述实体,通过大语言模型算法,提取所述实体之间的关系;所述实体抽取模块还包括:基于所述大语言模型算法,判定所述实体的复杂度,若复杂度高于预设阈值,则调用所述数据收集与清洗模块,基于相似度计算算法收集所述外部知识库,将一至多个外部知识库依据相似度排序加入所述候选数据库;基于新加入的外部知识库与目标知识的相关性、支撑性和可用性,评估新加入的所述外部知识库的质量,以及判定所述新加入的外部知识库的加入时机时间点。
全文数据:
权利要求:
百度查询: 湖南汇视威智能科技有限公司 基于大语言模型算法的知识抽取系统以及知识抽取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。