首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于混合多原型的小样本命名实体识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国人民解放军国防科技大学

摘要:本发明公开了基于混合多原型的小样本命名实体识别方法,包括以下步骤:从训练和测试数据集中采样片段,片段包括支持集和查询集;对于支持集,采用实体标签扩充序列,以丰富句子的语义;使用编码器来嵌入支持集和查询集中的序列,产生具有上下文信息的符号和标签嵌入;基于具有上下文信息的符号和标签嵌入,生成所有类的混合多原型表示;根据符号与混合多原型类表示的距离来预测查询集中词的标签。本发明方法提出了一种新的多原型类表示策略,以减少潜在的表示偏差,提高单原型方法的表达能力;设计了一种混合策略来构造实体类和非实体类的多原型,由此使得本发明识别效果非常高。

主权项:1.基于混合多原型的小样本命名实体识别方法,其特征在于,包括以下步骤:步骤1,从训练和测试数据集中采样片段,片段包括支持集和查询集;步骤2,对于支持集,采用实体标签扩充序列,以丰富句子的语义;步骤3,使用编码器来嵌入支持集和查询集中的序列,产生具有上下文信息的符号和标签嵌入;步骤4,基于具有上下文信息的符号和标签嵌入,生成所有类的混合多原型表示;步骤5,根据符号与混合多原型类表示的距离来预测查询集中词的标签;步骤5中,给定查询序列和查询序列的符号嵌入首先计算符号属于每个类别的概率,然后把概率最高的类别赋值给符号属于类c的概率计算如下: 其中,mindis表示符号嵌入与这个类的多原型表示之间的最小距离,cj表示第j个类的多原型;在训练阶段,使用负对数似然损失来更新编码器中参数: 其中,表示对于预测的标签,cg表示真实标签,p表示概率计算,N表示训练数据的查询集中的符号总数。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 基于混合多原型的小样本命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。