针对电力作业文本的知识图谱构建方法、装置、介质及芯片

导航：龙图腾网> 最新专利技术> 针对电力作业文本的知识图谱构建方法、装置、介质及芯片

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华北电力大学(保定)

摘要：一种针对电力作业文本的知识图谱构建方法、装置、介质及芯片，克服了现有技术中知识量少、识别率低、资源占用高的缺陷。该方法涵盖本体层定义、实体关系抽取、实体消歧、图谱构建等关键环节。通过预处理电力文本语料、构建词向量表、实体类型标注、LEBERT‑BiGRU‑CRF模型训练、关系标注、实体关系联合抽取及知识融合消歧等步骤，实现从文本中抽取实体及关系，并构建成可视化的电力作业知识图谱。引入了词汇增强和注意力机制，提升识别准确率，采用先实体识别后联合抽取的模式，有效解决实体重叠问题，优化知识抽取效果。将抽取的实体关系三元组导入图数据库，形成电力作业领域的知识库，为一种高效、精准的知识图谱构建方法。

主权项：1.一种针对电力作业文本的知识图谱构建方法，其特征在于，包括步骤：S1：本体层实体关系定义将收集得到的电力领域相关文本整合到文档中，结合电力领域专业知识对其中包含的实体及关系类型进行定义，得到实体类型集合和关系类型集合，其中实体类型集合为，关系类型集合为；S2：电力文本语料预处理过程；S3：实体类型标注、构建词表根据S1中定义的本体层实体类型，对语料进行实体标注，标注样本为S2预处理后得到的全部文本语料的20%-25%，同时需要保证实体类型在该标注样本中分布均匀；S4：训练模型抽取命名实体将S3中得到的实体识别数据集送入LEBERT-BiGRU-CRF模型中进行训练，基于训练完毕的模型，对S1形成的全部语料的50%内容进行实体标注；S5：关系类型标注对S4中输出的实体识别结果进行实体间关系类型的标注，标注格式为SPO格式，得到电力作业实体关系数据集，规模为全部语料的50%；S6：实体关系联合抽取将标注的实体关系数据集送入PRGCA模型进行训练，对全部语料进行实体关系联合抽取，实体关系联合抽取具体包括：（1）给定输入语句S，经过BERT预训练编码器得到包含n个tokens的句子嵌入h，首先预测句子中潜在关系的子集，后仅需识别潜在关系下的主客体，潜在关系预测的元素为：（7）（8）其中Avgpool是平均池化操作，是可训练权重，是Sigmod函数；该潜在关系预测过程为一个多标签分类任务，如果概率超过阈值，则为对应标签分配标签1，否则分配标签0，后续只需要将预测出的潜在关系用于抽取过程；（2）进行主客体标注前，使用注意力机制对表示向量进行权重分配，以充分利用位置信息，提升模型识别精度，优化得到向量c，优化过程如下：（9）（10）（11）式中，为输入的待优化向量，为学习函数，受到的影响，计算过程视为对输入向量的加权平均，确定权值后进行加权，得到优化向量；优化后的向量使用全连接网络进行两次序列标注操作分别识别主体和客体，能够有效解决实体重叠问题，对每个token的操作如下：（12）（13）其中是训练嵌入矩阵U中第j个关系表示，是第i个token的编码表示，、是训练权重；（3）序列标注后得到所有潜在关系中包含的主客体，下面使用全局标注矩阵来确定正确的主客体对；首先枚举句子中所有主客体对，然后在全局对应矩阵中将该实体对对应的分数与阈值进行比较，超过阈值则保留，否则进行过滤；矩阵中元素对应的值，即主客体对的置信度如下：（14）其中，、是形成潜在主客体对的输入语句中的第i个和第j个位置的token编码表示，为可训练权重，为Sigmod函数；全局矩阵输出的正确的主客体对结合关系，可以得到正确的三元组表示，表示为：主体，关系，客体；S7：知识融合消歧在抽取工作完成后，需要针对多词同义问题对实体库进行实体链接，使用BERT编码器将实体和其周围的语义信息映射到同一个向量空间中，对相似度设置阈值，该向量空间中相邻的实体中，其距离小于等于阈值时，视为同义实体，归并其名称及关系；S8：导入图数据库将知识抽取与融合得到的实体关系三元组导入Neo4j图数据库中，形成可视化的电力作业知识图谱。

全文数据：

权利要求：

百度查询：华北电力大学(保定) 针对电力作业文本的知识图谱构建方法、装置、介质及芯片

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种全固废水下不分散混凝土及其制备方法

下一篇：一种正负可调叠加高频脉冲的电源

相关技术

一种全固废水下不分散混凝土及其制备方法

一种正负可调叠加高频脉冲的电源

一种数据传输方法、装置、设备及计算机可读存储介质

一种电子水泵噪声振动测试台架装置及噪声测试方法

一种投影区域的确定方法、装置、设备及存储介质

金属燃料电池与其他类型蓄电池的协同应用系统及方法

时间校准方法及装置、车辆、服务器和存储介质

一种潮气量检测系统及装置

用于烯烃生产的配置

沸点检测方法、装置、存储介质、程序产品和烹饪设备

一种多级循环递进式抽奖系统

一种高效快照压缩视频字幕生成方法

图谱相关技术

基于预训练模型增强的图谱关系抽取方法_湖南董因信息技术有限公司_202410876214.9

海金沙药材的特征图谱的构建方法_广东一方制药有限公司_202310298677.7

基于大语言模型与知识图谱黑土保护与利用智能问答系统_中国科学院地理科学与资源研究所_202410780012.4

基于单细胞转录组图谱的药物筛选分析方法、介质及设备_浙江大学_202410991441.6

一种基于多视图知识图谱的辅助诊断方法及系统_中山大学_202411164369.6

一种基于知识图谱的电力施工安全管控方法及装置_安徽博诺思信息科技有限公司_202411173704.9

一种基于医学知识图谱对比学习的药物预测方法_扬州大学_202410708297.0

针对电力作业文本的知识图谱构建方法、装置、介质及芯片_华北电力大学(保定)_202410926138.8

一种基于知识图谱的目标路径挖掘方法_沈阳安华晟源信息科技有限公司_202410637032.6

基于知识图谱的集团股权穿透传导方法和系统_上海银行股份有限公司_202210644357.8

构建相关技术

一种建筑模型构建装置_芜湖青境科技有限公司_202410723568.X

用于在土壤中构建钻孔的钻头_海瑞克股份公司_202080064276.X

一种钢结构建筑连接装置_滨州市建筑设计研究院有限公司_202323445614.4

储能领域的词典的构建方法及其装置_沃太能源股份有限公司_202410728951.4

航天器总装状态模型构建方法及装置_北京卫星环境工程研究所_202410889144.0

锚杆内力监测系统的构建方法及装置_山东建勘集团有限公司_201911215994.8

一种电网多态协同平台及构建方法_国网江西省电力有限公司信息通信分公司_202411187164.X

基于元宇宙的展厅构建方法、装置及设备_深圳市创富金科技有限公司_202410961909.7

用于构建区域数据中心的虚拟引导环境_甲骨文国际公司_202380020618.1

三维类子宫模型、构建方法及其应用_中国科学院动物研究所_202410772923.2

方法相关技术

记录方法_精工爱普生株式会社_202410329157.2

分类方法_株式会社半导体能源研究所_202080059927.6

分离方法_大金工业株式会社_202380021486.4

唤醒信号的接收方法、发送方法、配置方法、装置及设备_OPPO广东移动通信有限公司_202280091619.0

原版、确定原版的图案的方法、曝光的方法、以及制造物品的方法_佳能株式会社_202410311669.6

信号传输方法、信号检测方法、装置及通信设备_维沃移动通信有限公司_202310304876.4

验证方法_上海兆芯集成电路股份有限公司_202011127602.5

接入处理方法、信息处理方法、配置发送方法及设备_维沃移动通信有限公司_202310290704.6

训练SEM图像选择方法及使用该方法的SEM设备对准方法_三星电子株式会社_202410252998.8

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023693.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

针对电力作业文本的知识图谱构建方法、装置、介质及芯片

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务