买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中南大学;湖南省第三测绘院
摘要:本申请涉及滑坡监测技术领域,提供了一种滑坡灾害语义信息抽取方法、装置、设备及介质。该方法包括:获取滑坡文献、滑坡指标、以及语义关系;抽取滑坡文献的滑坡词语,并进行标注得到真实关系三元组;利用知识抽取模型抽取实体关系三元组并生成错误关系三元组;基于真实关系三元组、实体关系三元组、错误关系三元组构建差异损失函数和区分损失函数,并获取综合损失函数;根据综合损失函数对知识抽取模型进行优化,利用优化后的知识抽取模型获取最终关系三元组;利用最终关系三元组构建滑坡图数据库;基于滑坡图数据库对待抽取滑坡文本进行语义信息抽取,得到语义信息抽取结果。该方法能够提高滑坡语义信息抽取的精确度并降低抽取难度。
主权项:1.一种滑坡灾害语义信息抽取方法,其特征在于,包括:获取多个滑坡文献、多个滑坡指标、以及每两个滑坡指标之间的语义关系;所述多个滑坡指标包括滑坡事件名称、滑坡基本属性、滑坡致灾因子、滑坡孕灾环境、滑坡承灾体;分别针对每个滑坡文献,抽取所述滑坡文献的多个滑坡词语,并基于所有滑坡指标和所有语义关系对每两个滑坡词语进行标注,得到所述滑坡文献的多个真实关系三元组;所述真实关系三元组的头实体和尾实体均为所述滑坡文献中的滑坡词语,所述真实关系三元组的关系为头实体和尾实体之间真实的语义关系;基于所有语义关系,利用知识抽取模型从每个所述滑坡文献中抽取多个实体关系三元组,并生成每个实体关系三元组对应的多个错误关系三元组;所述实体关系三元组的头实体和尾实体均为滑坡文献中的滑坡词语,所述实体关系三元组的关系为利用知识抽取模型抽取得到的语义关系,所述错误关系三元组的头实体和尾实体均为滑坡文献中的滑坡词语,所述错误关系三元组的关系为头实体和尾实体之间错误的语义关系;基于所有真实关系三元组、所有实体关系三元组构建差异损失函数,并基于所有实体关系三元组、所有错误关系三元组构建区分损失函数;所述差异损失函数用于描述所有真实关系三元组和所有实体关系三元组之间的差异,所述区分损失函数用于描述所有实体关系三元组与所有错误关系三元组之间的区分程度;根据所述差异损失函数和所述区分损失函数,获取综合损失函数;根据综合损失函数对所述知识抽取模型进行优化,得到优化后的知识抽取模型,并利用所述优化后的知识抽取模型获取每个所述滑坡文献的多个最终关系三元组;所述最终关系三元组的头实体和尾实体均为滑坡文献中的滑坡词语,所述最终关系三元组的关系为利用优化后的知识抽取模型抽取得到的语义关系;利用所有最终关系三元组构建滑坡图数据库;所述滑坡图数据库的多个节点与多个最终关系三元组中的滑坡词语一一对应,所述滑坡图数据库的每两个节点之间的边为对应的两个滑坡词语之间的语义关系;基于所述滑坡图数据库对待抽取滑坡文本进行语义信息抽取,得到多个语义信息抽取结果;所述语义信息抽取结果用于描述所述待抽取滑坡文本与滑坡灾害之间的关联信息;其中,所述差异损失函数为: 其中,表示所述差异损失函数的值,表示所有真实关系三元组,表示所有实体关系三元组中的关系均正确的概率;所述区分损失函数为: ;其中,表示区分损失函数的值,表示实体关系三元组的数量,表示第个实体关系三元组的权重,表示边缘阈值,表示激活函数,表示第个关系三元组的评分,所述第个关系三元组为所述第个实体关系三元组或所述第个实体关系三元组对应的一错误三元组,表示所述第个实体关系三元组对应的所有评分中大于评分阈值的多个评分,表示所述第个实体关系三元组对应的所有评分中小于等于所述评分阈值的多个评分,表示所述第个实体关系三元组对应的所有原始评分,表示所述第个关系三元组的原始评分,表示所述第个关系三元组的原始评分,所述第个关系三元组为所述第个实体关系三元组或所述第个实体关系三元组对应的一错误三元组,,表示所述第个实体关系三元组和所述第个实体关系三元组对应的错误关系三元组的数量和,表示常数。
全文数据:
权利要求:
百度查询: 中南大学 湖南省第三测绘院 一种滑坡灾害语义信息抽取方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。