首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于AI模型的海量实体快速关联的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:火石创造科技有限公司

摘要:本发明属于实体关联技术领域,具体公开了一种基于AI模型的海量实体快速关联的方法,其包括如下步骤:对企业标准名列表建立数值表示,将企业标准名列表表示成一个矩阵;对一个待关联企业名,去掉通用后缀、用浮点数表示为向量,然后与企业标准名列表对应的矩阵进行顺序对比,得到候选关联名称集;搭建同名判断模型,利用同名判断模型关联企业名;定义两个同名判断模型;从原文中识别出一个企业实体后,进一步得到其候选关联名称集,利用两个同名判断模型分别对候选关联名称集进行判断并关联企业名,用得到的结果相互印证。本发明方法利于实现对于海量级的企业实体标准名的快速、准确的关联。

主权项:1.一种基于AI模型的海量实体快速关联的方法,其特征在于,包括如下步骤:步骤1.对企业标准名列表建立数值表示,将企业标准名列表表示成一个M×N的矩阵;其中M表示企业标准名列表中每个名称的最大长度,N为企业标准名列表的长度;步骤2.对一个待关联企业名,将该待关联企业名表示为向量,然后与企业标准名列表对应的矩阵顺序对比,得到初筛结果,即候选关联名称集;步骤3.搭建同名判断模型,利用同名判断模型关联企业名;定义两个同名判断模型为模型1、模型2,模型1和模型2采用提示词模型和或大模型;训练同名判断模型的过程如下:模型1用名字判断,具体为:搜集企业别名对应关系,即表示相同企业的两个名称构成一个数据对;已有部分企业别名对应关系表,作为正样本对;为了搜集负样本对,对企业标准名列表中的每个名称,按照步骤2与企业标准名列表中其他名称对比,得到候选关联名称集,去掉正样本对剩下的即为负样本对;用正样本对、负样本对训练二分类模型,模型的输入为“候选企业名1,候选企业名2,...候选企业名P;与企业名A为相同企业的是___”;其中P为自然数;模型2在上下文中进行判断,具体为:为了处理不同上下文中对应不同企业名的情形,给出如下标注样本:“文本片段1,上文中企业名A是下列哪一个:候选企业名1,候选企业名2,...候选企业名P”;从原文中识别出一个企业实体后,用步骤2得到其候选关联名称集,利用模型1和模型2对候选关联名称集分别进行判断并关联企业名,用得到的结果相互印证。

全文数据:

权利要求:

百度查询: 火石创造科技有限公司 一种基于AI模型的海量实体快速关联的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。