恭喜广东横琴数说故事信息科技有限公司袁浩斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广东横琴数说故事信息科技有限公司申请的专利一种基于海量知识图谱及图嵌入的实体分类方法与系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114564579B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210103224.X,技术领域涉及:G06F16/35;该发明授权一种基于海量知识图谱及图嵌入的实体分类方法与系统是由袁浩斌;何宇轩;牟昊;李旭日;徐亚波设计研发完成,并于2022-01-27向国家知识产权局提交的专利申请。
本一种基于海量知识图谱及图嵌入的实体分类方法与系统在说明书摘要公布了:本发明提出一种基于海量知识图谱及图嵌入的实体分类方法及系统,涉及自然语言处理的技术领域,从海量语料文本出发,引入命名实体识别模型和关系抽取模型以抽取实体和关系,并形成知识图谱,然后借助图嵌入模型生成知识图谱内各种实体的图嵌入信息,即使用向量表征一个实体,然后基于各实体节点的图嵌入信息及实体的实体置信度,实现实体节点的分类,最后利用知识图谱进行再处理,清除分类任务结果杂音,通用性强,提高了准确率、召回率,便于实现大数据领域更好的业务分类效果。
本发明授权一种基于海量知识图谱及图嵌入的实体分类方法与系统在权利要求书中公布了:1.一种基于海量知识图谱及图嵌入的实体分类方法,其特征在于,包括:S1.获取N份语料文本,并对语料文本中的实体及实体关系进行标注,得到标注数据集;S2.引入命名实体识别模型和关系抽取模型,并利用标注数据集训练测试命名实体识别模型和关系抽取模型,以进行对海量语料文本中的实体识别和关系抽取;然后以实体和关系为基础,形成知识图谱;S3.引入图嵌入模型,利用图嵌入模型进行知识图谱中关联实体节点预测训练任务,得到各实体节点的图嵌入信息;步骤S3所述的利用图嵌入模型进行知识图谱中关联实体节点预测训练任务的过程为:S31.在知识图谱中选定初始实体节点,结合初始实体节点在知识图谱中的关系类型,利用图嵌入模型以初始实体节点预测终止尾节点;S32.将预测终止尾节点的节点类型、节点名称和节点间关系分别与真实终止节点的节点类型、节点名称和节点间关系对比,判断是否正确,若正确,保留图嵌入模型当前的参数权重,执行步骤S33;否则,调整图嵌入模型的参数权重,返回步骤S31;S33.基于图嵌入模型,由各个实体节点随机游走至知识图谱中的相邻实体节点,获取各个实体节点在知识图谱中的局部结构,从而得到每一个实体节点的图嵌入信息;S4.确定待分类的实体,计算实体的实体置信度;S5.基于各实体节点的图嵌入信息及实体的实体置信度,利用分类器执行待分类实体的分类任务,并利用知识图谱进行再处理,得到最终实体分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广东横琴数说故事信息科技有限公司,其通讯地址为:519000 广东省珠海市横琴新区宝华路6号105室-72989(集中办公区);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。