买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请适用于大数据挖掘技术领域,尤其涉及一种实体增强规则的挖掘方法、装置、设备及介质。该方法对候选谓词集合进行规则构建和规则挖掘,按照已知的目标,通过迭代、搜索和剪枝操作,找到挖掘出最佳的预设条数的规则,通过设置收益得分上下界和可信度对候选规则进行筛选,将有效的规则通过收益提升的方式进行判定,并且将已经处理过且未来扩展无法达到最佳的规则进行排除,限定了下一轮迭代的规则,降低不必要干扰,避免了多次迭代的规则冗余处理,由于规则处理量的降低有效地提高了处理效率。
主权项:1.一种实体增强规则的挖掘方法,其特征在于,所述挖掘方法包括:初始化初始挖掘规则集合和已使用谓词集合为空集,将候选谓词集合中每一个候选谓词分别与所述已使用谓词集合合并,得到对应候选谓词的已使用谓词集合,使用每个候选谓词的已使用谓词集合中所有谓词,结合已知规则的规则目标,构建得到对应的候选规则;根据预设的相关性度量和预设的多样性度量,对每个候选规则及其扩展得到的规则进行收益评分,得到每个候选规则对应收益得分上界和收益得分下界;计算每个候选规则的可信度,根据每个候选规则的收益得分上界、收益得分下界和可信度,确定候选最佳规则子集和下一轮迭代候选规则子集,将候选最佳规则子集中每个规则分别添加至所述初始挖掘规则集合,得到每个规则对应的更新规则集合;计算每个更新规则集合相较于所述初始挖掘规则集合的收益提升量,确定所述收益提升量最高的更新规则集合对应的规则为本轮迭代的最佳规则,将所述最佳规则添加至所述初始挖掘规则集合,得到更新的挖掘规则集合,将所述候选最佳规则子集中除最佳规则以外的规则添加至所述下一轮迭代候选规则子集,得到更新的下一轮迭代候选规则子集;在下一轮迭代中,以所述更新的下一轮迭代候选规则子集进行扩展搜索,得到扩展规则,将所述扩展规则作为所述候选规则,并将所述更新的挖掘规则集合作为所述初始挖掘规则集合,返回执行计算每个候选规则的可信度,直至所述更新的挖掘规则集合中规则条数达到预设条数或者达到预设迭代次数,得到更新的挖掘规则集合。
全文数据:
权利要求:
百度查询: 深圳计算科学研究院 实体增强规则的挖掘方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。