Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京大学黄书剑获国家专利权

恭喜南京大学黄书剑获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京大学申请的专利一种命名实体识别模型的训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114881031B

龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210428560.1,技术领域涉及:G06F40/295;该发明授权一种命名实体识别模型的训练方法是由黄书剑;李志成;鲍宇;张建兵;戴新宇;陈家骏设计研发完成,并于2022-04-22向国家知识产权局提交的专利申请。

一种命名实体识别模型的训练方法在说明书摘要公布了:本发明公开了一种命名实体识别模型的训练方法,利用预训练好的成分句法分析器,构建出输入文本的成分分析树;基于生成规则,通过所述成分分析树形成关键句法成分候选集合;通过掩蔽不同的关键句法成分,筛选出所述关键句法成分候选集合中最重要的两个关键句法成分;分别掩蔽实体和最重要的两个关键句法成分,得到两种词嵌入并引入一种门控机制对两种词嵌入进行融合,形成每个词最终的词嵌入表示;将文本中所述每个词最终的词嵌入表示作为输入,输入条件随机场中进行训练,得到命名实体识别模型。本发明加强了最终词嵌入的表达能力;省去标注样本数据所需的人力成本;有效减轻整个句子复杂语义的影响,简化人类阅读和理解的过程,可解释性较强。

本发明授权一种命名实体识别模型的训练方法在权利要求书中公布了:1.一种命名实体识别模型的训练方法,其特征在于,包括以下步骤:步骤101:利用预训练好的成分句法分析器,构建出输入文本的成分分析树;步骤102:基于生成规则,通过所述成分分析树形成关键句法成分候选集合;步骤103:通过掩蔽不同的关键句法成分,筛选出所述关键句法成分候选集合中最重要的两个关键句法成分;步骤104:分别掩蔽实体和最重要的两个关键句法成分,得到两种词嵌入并引入一种门控机制对两种词嵌入进行融合,形成每个词最终的词嵌入表示;步骤105:将文本中所述每个词最终的词嵌入表示作为输入,输入条件随机场中进行训练,得到命名实体识别模型;步骤104中所述“分别掩蔽实体和最重要的两个关键句法成分,得到两种词嵌入并引入一种门控机制对两种词嵌入进行融合,形成每个词最终的词嵌入表示”具体包括如下步骤:步骤301:对文本数据中的实体进行掩蔽,即将文本中组成实体的词替换为[mask],并通过步骤202中所述的编码器模块获取文本中的每个词的词嵌入表示h1;步骤302:对文本数据中的两个关键句法成分进行掩蔽,即将文本中组成这两个关键句法成分的词替换为[mask],并通过步骤202中所述的编码器模块获取文本中的每个词的词嵌入表示h2;步骤303:通过引入一种门控机制对h1和h2进行融合,得到文本数据中每个词的最终词嵌入表示h,所述门控机制的计算公式为:g=σW1·h1+W2·h2+b,其中σ表示sigmoid函数,W1和W2表示可训练参数矩阵,b表示偏置项;表示逐项相乘操作,1表示元素全部为1的高维向量,其维度与h1和h2相同;步骤105中“将文本中每个词的词嵌入表示作为输入,输入条件随机场中进行训练,得到命名实体识别模型”,具体包括如下步骤:步骤401:输入文本中每个词语的词嵌入表示,条件随机场进行前向计算,得到文本中每个词语被预测为各个实体类别的分数;步骤402:计算正确标注路径的分数以及所有可能标注路径的分数,基于最大似然估计定义模型的预测损失函数,所述预测损失函数公式为:其中,Preal为正确的标注序列,Pi为所有可能的标注序列,M为文本的字词数量,n为预先定义的实体类别数量;步骤403:计算损失函数的梯度并反向传播,更新步骤202中所述的编码器模块和条件随机场中的参数,对模型进行训练;步骤404:使用验证集评估模型的性能,评估的依据是计算验证集上的F1得分,计算公式为其中P代表准确率,R代表召回率;步骤405:记录训练过程中在验证集上取得最佳效果的模型,将其作为最终训练得到的命名实体识别模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210000 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。