恭喜中南大学王雅琳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中南大学申请的专利基于图神经网络的知识图谱实体对齐方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115271071B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210942556.7,技术领域涉及:G06N5/02;该发明授权基于图神经网络的知识图谱实体对齐方法、系统及设备是由王雅琳;周泽雄;郭静宇;谭栩杰;彭渝彬;林邠;隋庆开;王凯;袁小锋设计研发完成,并于2022-08-08向国家知识产权局提交的专利申请。
本基于图神经网络的知识图谱实体对齐方法、系统及设备在说明书摘要公布了:本公开实施例中提供了一种基于图神经网络的知识图谱实体对齐方法、系统及设备,属于数据处理技术领域,具体包括:步骤1,数据准备;步骤2,数据预处理;步骤3,构建图神经网络模型;步骤4,网络前向运算;步骤5,融合全局信息的分布迁移法;步骤6,融合局部信息的针对性负采样;步骤7,反向传播更新图神经网络模型权值参数;步骤8,重复步骤4至步骤7的内容,直至步骤7所述联合损失函数迭代达到预设条件;步骤9,整体匹配法输出对齐结果。通过本公开的方案,充分挖掘知识图谱中实体之间的全局以及局部信息,提升了知识图谱实体对齐任务的训练效率和精准度。
本发明授权基于图神经网络的知识图谱实体对齐方法、系统及设备在权利要求书中公布了:1.一种基于图神经网络的知识图谱实体对齐方法,其特征在于,包括:步骤1,准备数据集DBP15K的子集中英文图谱、日英文图谱和法英文图谱,获取来源不同的两个图谱的目标信息,其中,目标信息包括关系三元组、属性三元组、实体信息、关系种类信息和已对齐实体对;步骤2,数据预处理,针对每个图谱分别构建图谱的邻接矩阵、度矩阵,根据属性三元组以及实体信息获取每一个实体的初始嵌入向量,将已对齐实体对作为训练数据,即正样本集合S;步骤3,构建图神经网络模型,随机初始化图神经网络模型权值参数,与邻接矩阵相乘;步骤4,网络前向运算,将实体初始嵌入向量输入图神经网络模型,进行前向运算,并获得输出后的嵌入向量;步骤5,融合全局信息的分布迁移法,根据步骤4输出的嵌入向量,构建所有实体与实体之间的实际分布矩阵,计算融合全局分布信息的分布匹配损失函数所述步骤5具体包括:步骤5.1,按如下公式计算并构建实际分布矩阵: 其中,actual为实际分布矩阵,actuali,j表示实际分布矩阵中第i行第j列的元素,ei为图谱1中n个实体的第i个,vj为图谱2中m个实体的第j个,hei与hvj分别为ei与vj的嵌入向量,||·||即为嵌入向量求模运算,cos_sim为计算hei与hvj两者的相似度;步骤5.2,构建期望分布矩阵label,其为单位矩阵,即只在对角线元素上置为1;步骤5.3,按如下公式计算融合全局信息的分布匹配损失函数: 其中,为融合全局信息的分布匹配损失函数,DKLactual||label为针对actual和label计算的KL散度;步骤6,融合局部信息的针对性负采样,基于正样本集合S中每一个实体对,针对性选取多个错误样本构建所有负样本的集合S',并计算融合局部信息的三联体损失函数所述步骤6具体包括:步骤6.1,针对性选取错误样本:针对正样本集S中的每个正样本实体,在全局范围内挑选足量的错误实体构建错误样本集合,根据这些错误实体与对应正样本实体的距离进行错误实体排名,选取距离最小的前25个错误实体,合并所有正样本的错误实体集构建负样本集合S',负样本集合S'中,一个实体ei将与除已对齐实体vj外的25个错误实体构成25对负样本实体对;步骤6.2,计算融合局部信息的损失函数:融合局部信息损失函数计算公式如下: 其中,ei,vj为正样本实体对,即图谱1的第i个实体与图谱2的第j个实体对齐,ei,vk'为负样本实体对,即实体ei的25对负样本实体对的第k对,γ为分隔超参数,为分隔超参数、正样本间距以及负样本损失三联体组成的损失函数,fx,y为曼哈顿距离函数,即fx,y为|x-y|,αk为针对每一个负样本注意力权值,其计算公式如下: 其中,注意力权值公式根据负样本实体对距离分配权值;步骤7,反向传播更新网络权值参数,根据步骤5和步骤6所得到的和加权相加得到联合损失函数采用使联合损失函数最小的随机梯度下降算法更新图神经网络模型权值参数;步骤8,重复步骤4至步骤7的内容,直至步骤7所述联合损失函数迭代达到预设条件;步骤9,整体匹配法输出对齐结果,针对两个图谱的实体之间距离进行排名,从两个图谱中各粗排筛选前p个实体,根据p个实体的嵌入向量构建整体相似度矩阵,针对相似度矩阵采用KM算法确定可对齐实体对,作为对齐的最终结果输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中南大学,其通讯地址为:410000 湖南省长沙市岳麓区麓山南路932号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。