首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于软参数共享的民航不安全事件联合抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国民航大学

摘要:本发明公开了一种基于软参数共享的民航不安全事件联合抽取方法,主要对民航领域中非结构化的不安全事件文本中的事件信息包括事件触发词、事件类型、事件论元、论元角色进行抽取,形成结构化的数据形式。事件抽取包括两个子任务分别是事件识别任务和论元角色分类任务,本发明构建了一个基于软参数共享的联合抽取模型,该模型明确地分离了共享参数和任务特定参数,并通过双层门控网络增强模型提取和筛选语义知识的能力,使模型能同时为两个任务学习到合适的特征表示,实现了更高效的信息共享和联合表示学习,并解决两个任务由于任务差异性导致共享同一编码层时无法同时受益的现象,显著提高了事件抽取的整体效果。

主权项:1.一种基于软参数共享的民航不安全事件联合抽取方法,其特征在于:包括如下步骤:S1:收集民航领域的不安全事件文本数据,对这些数据进行预处理,用于构建事件抽取数据集,数据集格式为处理为Json格式的数据文件,并且按照8:1:1比例划分为训练集、验证集和测试集;S2:对划分好的数据集中的每条Json格式的事件数据进行处理得到模型所需要的输入格式和对应的标签数据;S3:建立基于软参数共享的民航不安全事件联合抽取模型,包括嵌入层,编码层,解码预测层;其中,嵌入层采用ChineseBERT作为预训练模型用于获得输入序列的字符集的嵌入向量表示,通过ChineseBERT获取输入文本的字符向量表示,作为编码层的特征输入;通过ChineseBERT获取每个事件句的字符向量表示,作为编码层的特征输入;编码层包括共享网络、私有网络和门控网络,并根据门控网络将编码层分为共享网络层,私有-共享网络层;共享网络由一组全连接网络作为其子网络构成,将嵌入层获取的字符级的嵌入向量作为输入,分别输入到每个子网络中,用于获取两个任务的共享知识,两个任务的通过各自第一层的门控网络对这组共享网络学习到的知识进行筛选然后作为各自任务学习到的共享知识,私有层为两个任务独享的网络层,分别将BiGRU网络作为两个任务的私有网络,提取到的特征向量表示和第一层共享网络提取到的特征向量表示通过第二层门控网络来进行有选择的特征融合,最终作为每个任务编码层的输出的特征表示,输出到下一层的解码预测层;解码预测层包括全连接网络和CRF网络,两个任务均采用序列标注方式,在解码预测阶段,采用Viterbi动态规划算法求解总得分最高的标签序列作为最优序列;基于软参数共享的民航不安全事件联合抽取模型的实现过程如下:S31:将输入的事件句通过嵌入层映射为字级别的嵌入向量表示;S32:将该向量表示分别输入到编码层中的共享网络,私有网络,门控网络中,进行特征提取与特征融合,得到两个任务各自的特征表示;S33:分别输入到两个任务的解码预测层,通过条件随机场进行解码,从所有可能的序列标签中选择出句子级别的全局最佳标签序列作为最终输出;S4:将S2处理后的数据按照batchsize大小批量随机送入构建好的基于软参数共享的民航不安全事件联合抽取模型中进行迭代训练,并每训练一个epoch用验证集验证模型的效果,评测指标为准确率,召回率和F1值,若事件识别和论元角色分类F1值同时大于上一轮训练的F1值时,则保存模型,并设置早停,若迭代一定次数F1值都不在上升时,则停止训练,保存验证集上的最优模型;S5:将最终保存的最优模型作为目标模型,将测试集样本批量送入目标模型中,输出与保存抽取的结果。

全文数据:

权利要求:

百度查询: 中国民航大学 一种基于软参数共享的民航不安全事件联合抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。