恭喜厦门数据谷信息科技有限公司何志昭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜厦门数据谷信息科技有限公司申请的专利一种基于知识增强预训练模型的命名实体识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119494347B 。
龙图腾网通过国家知识产权局官网在2025-04-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510073770.7,技术领域涉及:G06F40/295;该发明授权一种基于知识增强预训练模型的命名实体识别方法及系统是由何志昭;陈志敏;杨文锋设计研发完成,并于2025-01-17向国家知识产权局提交的专利申请。
本一种基于知识增强预训练模型的命名实体识别方法及系统在说明书摘要公布了:本发明公开了一种基于知识增强预训练模型的命名实体识别方法及系统,涉及命名实体识别技术领域,为了解决现有的训练模型无法更准确地进行命名实体识别的问题。本发明通过引入知识增强预训练模型,模型能够学习到更多的先验知识和语义信息,从而提升对未见过的文本数据的泛化能力,通过详细的性能评估和优化过程,模型的可解释性得到了增强,有助于理解模型的工作机制,从而更好地调整和优化模型,经过优化的模型在泛化能力上也有所提升,能够更好地适应不同的应用场景和数据集,监控日志的生成使得性能分析和问题追踪更加便捷,有助于持续优化模型性能,能够根据目标应用终端上的用户反馈进行标准知识增强训练模型的改进。
本发明授权一种基于知识增强预训练模型的命名实体识别方法及系统在权利要求书中公布了:1.一种基于知识增强预训练模型的命名实体识别方法,其特征在于,包括如下步骤:S1:文本数据采集处理:从数据库中将文本数据进行收集,文本数据收集后进行数据处理,数据处理后得到目标文本数据;S2:知识库构建:从知识库中将知识信息源进行确认,将确认的知识信息源与目标文本数据进行知识图谱构建,知识图谱构建后得到目标知识图谱数据;设置目标知识图谱数据的刷新频率,包括:利用所述目标知识图谱数据中每个实体所对应的关系数量和每个实体的每条关系对应的关联系数获取每个实体对应的关系强度系数: 其中,S表示关系强度系数;n表示每个实体所对应的关系数量;Gi表示每个实体所对应的第i个关系的关联系数;N表示所述目标知识图谱数据所包含的关系数量总数;Gc表示预设的关联系数参考值;Gmax表示每个实体所对应的关联系数最大值;Gzmax表示目标知识图谱数据所包含的关联系数最大值;Gz表示目标知识图谱数据所包含的关联系数中间值;将所述关系强度系数与预设的强度系数阈值进行比较,以确定刷新频率;S3:训练模型选择和处理:根据命名实体识别规则将训练模型进行选择,并对选择的训练模型进行调整,调整后得到识别训练模型;S4:知识增强模型训练:将目标知识图谱数据嵌入识别训练模型,并对嵌入目标知识图谱数据的识别训练模型进行模型训练,模型训练后得到知识增强模型;S5:命名实体识别:将待识别文本输入至知识增强模型中进行命名实体模拟识别,并对命名实体模拟识别结果进行识别结果处理,识别结果处理后得到命名实体数据;S6:增强模型评估和优化:将命名实体数据进行性能评估,根据性能评估结果对知识增强模型进行优化调整。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门数据谷信息科技有限公司,其通讯地址为:361000 福建省厦门市软件园二期望海路59号702室A单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。