买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:合肥工业大学
摘要:本发明涉及数据查询领域,提供了一种匿名信息源网络实体消岐方法、设备及存储介质,方法为:获取实体‑实体网络,信息源‑信息源网络和实体‑信息源网络;在每个网络中计算角色导向随机游走概率值,分别得到每个网络的随机游走序列;根据每个网络的随机游走序列,得到每个网络的随机游走序列的正样本;在三个网络中计算负采样值,并按值排序自适应负采样,得到每个网络对应的负样本;根据正负样本进行训练,利用训练好的网络及聚类方法完成同名消歧。本发明能在匿名情况下提高同名实体消歧结果准确率。
主权项:1.一种匿名信息源网络实体消岐方法,其特征在于:包括以下步骤:S1:获取信息源数据集,并对其进行实体识别,得到每个信息源的实体集,同时进行匿名处理,得到实体-实体网络Gaa,信息源-信息源网络Gdd和实体-信息源网络Gad;S2:在每个网络中计算角色导向随机游走概率值,分别得到每个网络的随机游走序列;S3:根据每个网络的随机游走序列,得到每个网络的随机游走序列的正样本;S4、在三个网络中计算负采样值,并按值排序自适应负采样,得到每个网络对应的负样本;S5、根据每个网络的随机游走序列所有节点的正样本以及每个网络对应的负样本,得到每个网络的损失函数,并根据每个网络的损失函数得到总体损失函数;S6、根据总体损失函数训练,直至损失函数收敛;S7、损失函数收敛后,若用户知道真实关注的同名实体数,则采用层次聚类法区分真实实体对应的信息源,否则采用DBSCAN聚类法得到自适应的消歧信息源。
全文数据:
权利要求:
百度查询: 合肥工业大学 一种匿名信息源网络实体消岐方法、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。