恭喜浙江工业大学杨旭华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江工业大学申请的专利一种基于实体重要性和相似性的电商知识图谱补全方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114996471B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210564352.4,技术领域涉及:G06N5/022;该发明授权一种基于实体重要性和相似性的电商知识图谱补全方法是由杨旭华;童越;熊贞;张宇辰;蒋智捷;陈昊楠;朱慷亮设计研发完成,并于2022-05-23向国家知识产权局提交的专利申请。
本一种基于实体重要性和相似性的电商知识图谱补全方法在说明书摘要公布了:一种基于实体重要性和相似性的电商知识图谱补全方法,将电商知识图谱以三元组形式表示,计算电商实体的重要性;通过电商实体相似性分类把实体划分成不同类别,并在此基础上生成负三元组集合;初始化电商知识图谱的实体和关系嵌入向量集合;计算电商知识图谱中所有关系的一阶重要性;计算所有正三元组中关系的高阶重要性,计算所有负三元组中关系的预设高阶重要性;计算所有正、负三元组关系的综合重要性;获取所有正、负三元组的重要性;通过最小化损失函数获取实体嵌入向量集合和关系嵌入向量集合;得到补全三元组。本发明考虑了电商知识图谱的实体和关系的重要性,根据相似性分类选取高质量负样本,计算速度快,补全准确度高。
本发明授权一种基于实体重要性和相似性的电商知识图谱补全方法在权利要求书中公布了:1.一种基于实体重要性和相似性的电商知识图谱补全方法,包括如下步骤:步骤1:一个电商知识图谱包括实体以及实体之间的关系,所述实体包括用户、用户属性、商品和商品属性;一个电商知识图谱用三元组形式表示为GE,R,S,其中,E表示N个电商实体的集合{e1,e2,e3,...,eN},R表示实体间M种关系的集合{r1,r2,r3,...,rM},S为电商知识图谱中所有三元组h,r,t的集合,其中h∈E代表头实体,t∈E代表尾实体,r∈R为头实体和尾实体之间的关系;步骤2:在电商知识图谱G中,初始化每个实体的重要性为1,任意选取一个实体u,计算其实体重要性: 其中 其中,实体j为实体u的相连实体,inj表示与实体j相连的实体集合,α∈0,1为游走参数,outi表示实体i的出度,遍历电商知识图谱中每个实体,重复迭代计算该步骤,获得电商知识图谱所有实体的重要性;步骤3:在电商知识图谱G中,任意选取两个实体ei和ej,计算二者的相似性指标: 其中ψei表示与实体ei相连接的关系-实体对,|ψei∩ψej|表示实体ei和ej的公共关系-实体对的数量,Γei表示与实体ei相连接的三元组集合,|Γei∪Γej|表示与实体ei,ej相连的所有三元组的数量;遍历电商知识图谱,获得任意两个实体间的相似性指标;步骤4:在电商知识图谱G中,任意选取一个实体ei,连接和其相似性指标最高的实体ej,遍历整个电商知识图谱,连接所有实体和其相似性指标最高的实体,电商知识图谱会形成若干个实体社区;社区内部实体属于同一类别彼此连通,不同社区实体属于不同类别彼此不相连通,社区数量等于实体类别数量;步骤5:将电商知识图谱的实体和关系映射到n维向量空间中,其中实体i的嵌入向量表示为σei={σei1,σei2,...,σein},关系i的嵌入向量表示为δri={δri1,δri2,...,δrin},其中,实体嵌入向量集合为Ev={σe1,σe2,...,σeN},关系嵌入向量集合为Rv={δr1,δr2,...,δrM},随机选取n维数据初始化电商知识图谱G的实体和关系嵌入向量集合;步骤6:在电商知识图谱G中,任取一个关系ri,计算其一阶邻居实体之间的关系重要性 其中hvi和tvi分别为关系ri的头实体hi和尾实体ti的嵌入向量,||·||2代表向量的模,遍历电商知识图谱G中所有关系,获取所有关系的一阶关系重要性;步骤7:在电商知识图谱G中,任取一个正三元组的关系ri,计算其高阶重要性 其中,表示关系ri的尾实体,表示关系ri的头实体,Eimphi和Eimpti分别表示实体hi和ti的实体重要性,其中表示包含关系ri的三元组数量,表示包含关系ri的尾实体的数量,表示包含关系ri的头实体的数量,遍历电商知识图谱G,获取所有正三元组中关系的高阶重要性;步骤8:在电商知识图谱G中,任意选取一个正三元组h,r,t,头实体以tphtph+htp或尾实体以hpttph+hpt的概率替换为该实体所在社区中的任意实体以此构建负三元组h,r,t',遍历电商知识图谱中正三元组集合S中所有的三元组,重复执行步骤8,得到替换实体后的负三元组集合S';步骤9:在负三元组集合S'中,任取一个负三元组的关系ri,计算其预设高阶重要性 遍历负三元组集合S',获取负三元组中关系的预设高阶重要性;步骤10:在电商知识图谱G中,任取一个正三元组的关系ri,计算其综合重要性 其中β是超参数,遍历电商知识图谱G,获取所有正三元组中关系的综合重要性;步骤11:在负三元组集合S'中,任取一个负三元组的关系ri,计算其综合重要性 遍历负三元组集合S',获取所有负三元组中关系的综合重要性;步骤12:在电商知识图谱G,任取一个正三元组pti,计算其权重 遍历电商知识图谱G,获取所有正三元组的重要性;步骤13:在负三元组集合S'中,任取一个负三元组nti,计算其权重 其中,Eimphi和Eimpti′表示实体hi和ti′的重要性,Rimpri表示正三元组中ri的关系重要性,Rimp′ri表示负三元组中ri的关系重要性;遍历负三元组集合S',获取所有负三元组的重要性;步骤14:计算损失函数:L=∑h,r,t∈S∑h′,r,t′∈S′[γ+w+tdh+r,t-w-t'dh′+r,t′]+11其中γ为边距超参数,[]+表示取正部运算,d为h+r和t之间的距离,是h、r和t相应嵌入向量计算结果的模;步骤15:重复执行步骤12~步骤14,更新电商知识图谱G的实体嵌入向量和关系嵌入向量,直到L小于指定损失值后,终止迭代计算,获得最终的电商知识图谱G的实体嵌入向量集合和关系嵌入向量集合;步骤16:从电商知识图谱任意选取不完整三元组h,r,?,其中?表示缺失的电商实体,遍历电商知识图谱G的实体集合,计算dh+r,t,选取最小d值对应的实体t作为当前三元组补全结果,得到补全三元组h,r,t。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市拱墅区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。