首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于BERT的多神经网络的滑坡危险性评估命名实体识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:西南交通大学

摘要:本发明提出了一种基于BERT的多神经网络的滑坡危险性评估命名实体识别方法,该方法主要包括了以下内容:1获取包含滑坡危险性评估的英文文献,采用StanfordCoreNLP自然语言工具包和BIO标记法对文献摘要进行标注,标注包含滑坡发生位置、滑坡影响因子及滑坡危险性评估方法信息;2将滑坡危险性评估语料按照一定的比例划分为训练集、测试集和验证集,采用BERT模型以及变体模型如ALBERT和RoBERTa作为预训练语言模型对滑坡危险性评估数据集进行编码,对比不同模型的命名实体识别效果,获取上下文语义依赖信息生成更具代表性和表达能力的词向量;3将得到的词向量输入BiLSTM层学习文本长距离语义信息,之后将捕捉到的语义向量输入CRF解码层进行解码,得到滑坡危险性评估领域的最优命名实体识别结果。本发明通过BERT及其变体模型在自然语言处理方面的强大效果,同时利用BiLSTM和CRF融合特征向量用于滑坡危险性评估命名实体识别任务,具有更强的特征提取能力。

主权项:1.基于BERT的多神经网络的滑坡危险性评估命名实体识别方法,其特征在于,包括如下步骤:步骤1、语料库构建:收集包含滑坡危险性评估信息的英文文献摘要,对其进行预处理生成规范化的结构化数据,构建滑坡危险性评估领域预料库;步骤2、数据标注:采用StanfordCoreNLP自然语言工具包对数据进行分词、词性标注以及句法分析,再使用BIOBeginning-Inside-Outside标记法对滑坡危险性评估命名实体进行人工标注,包含滑坡发生位置、滑坡影响因子及滑坡危险性评估方法;步骤3、将标注数据按照一定的比例划分为训练集、测试集和验证集,利用BERT及其变体ALBERT和RoBERTa等预训练语言模型,对标注数据进行编码,获取包含上下文语义信息的词向量表示;步骤4、将步骤3中得到的词向量输入到BiLSTMBi-directionalLongShort-TermMemory模型中,用于捕捉输入序列的长程依赖语义特征;步骤5、考虑到序列内标签之间的关系和约束,基于CRF解码层对整个输入序列的标注路径进行解码;步骤6、基于BERT的多神经网络对目标域语料数据集进行微调获得最佳命名实体识别结果。

全文数据:

权利要求:

百度查询: 西南交通大学 一种基于BERT的多神经网络的滑坡危险性评估命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。