首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种可扩充的多事件信息联合抽取的方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京乾图科技有限公司

摘要:本发明提供一种可扩充的多事件联合抽取的方法及装置,所述方法包括以下步骤:S1、获取带抽取文本数据;S2、通过Bert‑GlobalPointer模型对文本进行已有事件类型的信息抽取,抽取得到文本内各个事件类型及其触发词和论元;S3、利用大语言模型对文本进行未训练事件类型的信息抽取,抽取得到文本内各个事件类型及其触发词和论元;S4、将S2和S3的结果进行组合,得到最终的事件抽取结果;S5、最终的事件抽取结果存入到数据库中。该方法将Bert‑GlobalPointer模型和大语言模型相结合,无需重新训练即可扩充已有事件抽取模型,可泛化性和可扩展性较强。

主权项:1.一种可扩充的多事件联合抽取的方法,其特征在于,包括以下步骤:S1、获取待抽取文本数据;S2、通过Bert-GlobalPointer架构模型对文本进行已有事件类型的信息抽取,抽取得到文本内各个事件类型及其触发词和论元;S3、利用大语言模型对文本进行未训练事件类型的信息抽取,抽取得到文本内各个事件类型及其触发词和论元;S4、将S3和S3的结果进行组合,得到最终的事件抽取结果;S5、将所述最终的事件抽取结果存入到数据库中;所述步骤S2包括:S21、对文本数据进行预处理操作,预处理操作包括清洗、分词和磁性标注;S22、利用Bert分词器对S21步骤预处理后的文本数据进行编码,得到文本的向量表示数据;S23、利用S0定期训练好的Bert-GlobalPointer架构模型对S22得到的文本向量进行事件类型-事件触发词和事件类型-事件论元的联合抽取;S24、利用S23的抽取结果构建无向图,将每个论元和触发词都作为图上的节点,同一事件的论元和触发词之间构成边;S25、在S24构成的无向图中搜索连通分量,每个连通分量解码成一个事件,来进行事件划分;S26、将划分的事件进行组合,得到已训练事件类型抽取结果。

全文数据:

权利要求:

百度查询: 北京乾图科技有限公司 一种可扩充的多事件信息联合抽取的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。