首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向电力规划评审领域的命名实体识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:国网四川省电力公司经济技术研究院

摘要:本发明公开了一种面向电力规划评审领域的命名实体识别方法,包括S1:根据样本语料数据集特征,设立多个刻画实体不同性质的实体标签,获得分词后的样本语料;S2:将分词后的样本语料加载到Glove模型以训练词向量,按位置拼接后得到文本序列向量矩阵;S3:利用多尺度卷积网络对文本序列向量矩阵卷积后重组池化,提取出序列中词粒度的词汇信息;S4:将以文本序列向量矩阵为输入的BiLSTM网络中前向LSTM和后向LSTM末尾状态进行拼接,提取出序列中句粒度的词缀信息;S5:利用Cross‑Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最后通过CRF层完成命名实体识别。本发明在一定程度上提高了电力规划评审领域命名实体识别的效率。

主权项:1.一种面向电力规划评审领域的命名实体识别方法,其特征在于,包括以下步骤:步骤S1:根据样本语料数据集特征,设立多个刻画实体不同性质的实体标签,获得分词后的样本语料;步骤S2:将分词后的样本语料加载到Glove模型以训练词向量,按位置拼接后得到文本序列向量矩阵步骤S3:利用多尺度卷积网络对文本序列向量矩阵卷积后重组池化,提取出序列中词粒度的词汇信息;步骤S4:将以文本序列向量矩阵为输入的BiLSTM网络中前向LSTM和后向LSTM末尾状态进行拼接,提取出序列中句粒度的词缀信息;步骤S5:利用Cross-Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最后通过CRF层完成命名实体识别;步骤S5中,所述利用Cross-Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,最终通过CRF模块完成命名实体识别,包括:将融合词粒度词汇信息的序列向量与矩阵WQs、WKs、WVs相乘,分别得到查询向量关键词向量键值向量运用多头自注意力机制计算公式得到输出矩阵Zs;经过多头自注意力机制部分后,输出矩阵Zs与矩阵WQc作矩阵乘法,得到特征间注意力机制模块的查询向量矩阵Qc;特征间注意力机制模块的关键词向量矩阵Kc和键值向量矩阵Vc则分别由另一流的多头自注意力机制输出Zs′与矩阵WKc、WVc相乘得到;通过注意力输出计算公式得到左右双流特征间注意力机制模块的输出Zc、Zc′;利用残差网络结构将输出与拼接并进行层归一化;经过前馈神经网络后,利用残差网络结构将前馈神经网络前后的输入输出拼接起来,并进行层归一化;步骤S5中,所述利用Cross-Transformer模块对序列中词粒度的词汇信息和序列中句粒度的词缀信息进行融合,还包括:将融合句粒度的词缀信息的序列向量与矩阵WQs、WKs、WVs相乘,分别得到查询向量矩阵关键词向量矩阵键值向量矩阵运用多头自注意力机制计算公式得到输出矩阵Zs;经过多头自注意力机制部分后,输出矩阵Zs与矩阵WQc作矩阵乘法,得到特征间注意力机制模块的查询向量矩阵Qc;特征间注意力机制模块的关键词向量矩阵Kc和键值向量矩阵Vc则分别由另一流的多头自注意力机制输出Zs′与矩阵WKc、WVc相乘得到;通过注意力输出计算公式得到左右双流特征间注意力机制模块的输出Zc、Zc′;利用残差网络结构将输出与拼接并进行层归一化;经过前馈神经网络后,利用残差网络结构将前馈神经网络前后的输入输出拼接起来,并进行层归一化。

全文数据:

权利要求:

百度查询: 国网四川省电力公司经济技术研究院 一种面向电力规划评审领域的命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。