恭喜北京中科凡语科技有限公司翟飞飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京中科凡语科技有限公司申请的专利命名实体识别模型的建立方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115146638B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210376496.7,技术领域涉及:G06F40/295;该发明授权命名实体识别模型的建立方法、系统、设备及存储介质是由翟飞飞设计研发完成,并于2022-04-11向国家知识产权局提交的专利申请。
本命名实体识别模型的建立方法、系统、设备及存储介质在说明书摘要公布了:本公开提供一种命名实体识别模型的建立方法,包括如下步骤:S1:使用训练集和开发集进行模型训练,生成基准模型,并使用该基准模型对无标签数据进行标注,获得标注数据,将标注数据作为标准答案;S2:基于获取队列系统,将无标签数据依次分布在队列空间中;S3:将队列空间中的标注数据之外的伪数据加入用于模型训练的训练数据进行模型训练;选择对基准模型性能提升最明显的选出队列数据作为最优数据加入训练集,并把选出队列数据从无标签数据中移除;S4:循环步骤S1~S3,直到模型性能不再提升或用完无标签数据为止。
本发明授权命名实体识别模型的建立方法、系统、设备及存储介质在权利要求书中公布了:1.一种命名实体识别模型的建立方法,其特征在于,包括如下步骤:S1:使用训练集和开发集进行模型训练,生成基准模型,并使用该基准模型对无标签数据进行标注,获得标注数据,将该标注数据作为标准答案;S2:基于获取队列系统,将无标签数据依次分布在队列空间中;S3:将队列空间中的所述标注数据之外的伪数据分别加入用于模型训练的训练数据进行模型训练;选择对模型性能提升最明显的选出队列数据作为最优数据加入训练集,并把所述选出队列数据从无标签数据中移除;以及S4:循环步骤S1~S3,直到模型性能不再提升或用完无标签数据为止;步骤S2中,包括:S21:将所有无标签数据都放入队列0,其余队列设空;S22:选择步骤S1模型训练过程中特定数目n的单轮次模型;S23:对于每个单轮次模型,使用该单轮次模型与基准模型的标注结果即所述标准答案进行比较,在每一轮循环中对比该单轮次模型标注数据与标准答案的参数差异,所述参数包括实体边界、实体类别和实体数目;将队列数据间隔放置,完全一致则升至高一级队列,否则降至低一级队列,循环完毕后返回所述队列系统;步骤S23中,采用绝对模式对于模型所标注实体进行判定,当使用队列数据与最优模型对标注结果进行比较时,只有两个语句中模型所标注实体同时满足数目、边界及类型完全一致时,判定为标注相同的数据,能够升至高一级的队列中,否则降至低一级的队列中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中科凡语科技有限公司,其通讯地址为:100190 北京市海淀区知春路63号51号楼10层1006;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。