Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜朗坤智慧科技股份有限公司袁存发获国家专利权

恭喜朗坤智慧科技股份有限公司袁存发获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜朗坤智慧科技股份有限公司申请的专利一种自动化构建工业知识图谱的方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119397038B

龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510014496.6,技术领域涉及:G06F16/36;该发明授权一种自动化构建工业知识图谱的方法、系统、设备及存储介质是由袁存发;毕瑞峰;陆文迪;胡迪;徐兴云;张强设计研发完成,并于2025-01-06向国家知识产权局提交的专利申请。

一种自动化构建工业知识图谱的方法、系统、设备及存储介质在说明书摘要公布了:本发明公开一种自动化构建工业知识图谱的方法、系统、设备及存储介质,包括:针对非结构化数据建立嵌入层将词映射为词向量,通过前馈神经网络获取词向量中的实体及类别,对各个实体间的关系进行判断抽取后构建第一知识图谱;针对结构化数据利用三元组将数据结构映射为本体及关系,根据映射关系获取实体与实体间的关系结构后构建第二知识图谱;定期执行数据抓取任务,检测更新的数据并进行动态知识融合后更新和优化第一知识图谱和第二知识图谱。本发明能够实现结构化数据到三元关系的转化,减少大量的人工标注与知识图谱的生成过程;并且能够实现企业级数据知识图谱的定制化构建,有利于数据挖掘分析,以实现多系统的结合以及数据的整合与共享。

本发明授权一种自动化构建工业知识图谱的方法、系统、设备及存储介质在权利要求书中公布了:1.一种自动化构建工业知识图谱的方法,其特征在于:包括,针对非结构化数据建立嵌入层将词映射为词向量,通过前馈神经网络获取所述词向量中的实体及类别,对各个实体间的关系进行判断抽取后构建第一知识图谱;所述建立嵌入层将词映射为词向量包括,基于工业知识词典将所述非结构化数据中的每个词语随机映射到一个多维度的向量,针对输入文本序列X=[x1,x2,…,xn]中的每个词语查找对应的嵌入矩阵获取对应的向量表示en,即将所述输入文本序列X=[x1,x2,…,xn]映射为词向量序列E=[e1,e2,…,en],其中,xn表示输入文本序列中的第n个词语;通过正弦和余弦函数生成法对所述非结构化数据中的每个词语进行位置编码,设定所述输入文本序列的长度为L,所述词向量的维度为d,则第pos个位置的词语对应的编码P在第i个维度的值由正弦余弦函数表示为:i为偶数时:i为奇数时:第n个词语对应的位置编码P表示为通过将所述词向量序列和位置编码进行相加得到结合词语语义和位置信息的向量序列Z,所述向量序列Z作为后续多层的注意力机制和前馈神经网络的初始输入;所述通过前馈神经网络获取所述词向量中的实体及类别包括,设置多头注意力机制的注意力头的数量,使用Xavier方法随机初始化权重矩阵WQ、Wk、Wv,将所述向量序列Z作为输入序列通过所述初始化后的权重矩阵进行计算后映射为查询向量Q、键向量K和值向量V;计算注意力得分,并使用所述查询向量Q和键向量KT之间的点积衡量相似度,其中,键向量KT为同模型下另一个词语的键向量K;应用softmax函数将所述注意力得分标准化为一个概率分布使得所有注意力权重的和为1,并获取当前词和其他词语的相似度权重,利用所述相似度权重对所述值向量V进行加权求和得到每个查询向量最终的表示;将多头注意力机制中多个头的输出进行拼接后输入前馈神经网络进行拼接和归一化处理,得到输出向量h;对所述输出向量h进行softmax操作,得到每个标记属于各个实体标签的概率分布,选择具有最高概率的标签作为每个标记的最终预测标签,即根据所述每个标记的最终预测标签获取所述词向量序列中的实体及类别,针对所述最终预测标签及真实标签进行交叉熵损失判断,通过链式法则计算交叉熵损失相对于logits的梯度,再计算损失函数相对于模型参数的梯度;反复迭代多头注意力机制和前馈神经网络的处理流程,使用梯度下降优化方法优化调整权重矩阵WQ、Wk、Wv,当所述交叉熵损失达到收敛后结束迭代;所述对各个实体间的关系进行判断抽取包括,根据获取的所述词向量序列中的实体及类别计算各实体对中的关系,针对实体对e1和e2,其在序列中的起始和结束位置分别为s1,e1和s2,e2,其中,s1和e1分别表示某个实体在句子中的起始位置和结束位置的token索引,使用预训练语言模型BERT,从输出中计算实体对的表示: 其中,hi表示从起始位置s1到结束位置e1之间的token的隐藏状态,表示从位置s1到e1的所有token隐藏状态的求和,表示归一化因子,用于计算token隐藏状态的平均值;所述构建第一知识图谱包括,将两个实体对的表示进行拼接,并利用一个全连接层对所述拼接的实体对表示进行分类,通过softmax函数计算所述分类后的实体对中每个关系类别的概率,将预测关系标签为概率最高的类别对应的实体对及关系依次导入知识图谱中,即可得到基于当前文本序列的第一知识图谱;针对结构化数据利用三元组将所述结构化数据的数据结构映射为本体及关系,根据映射关系获取实体与实体间的关系结构后构建第二知识图谱;所述构建第二知识图谱包括,针对结构化数据,将数据库中每类数据实体定义为本体,每条数据定义为实体,系统根据配置自动检索数据库数据,根据本体对应的数据表数据构建当前本体对应的实体对象,每条数据代表一个对应的知识图谱实体,每条数据的各个字段即为当前实体的属性信息,通过对应的字段配置及数据填充实体属性,完成对应的知识图谱内节点的生成;根据本体查找已和当前本体维护自定义关系的其他本体,并通过主外键关系构建实体与实体间关系,根据所述实体与实体间关系构建第二知识图谱;定期执行数据抓取任务,检测更新的数据并进行动态知识融合,根据所述动态知识融合的结果更新和优化所述第一知识图谱和所述第二知识图谱;所述检测更新的数据并进行动态知识融合包括,提供知识图谱的可视化检索、修订功能,用户通过实体名称、本体名称、属性关键词进行知识图谱的模糊检索,通过可视化的操作查看各实体对象及实体间的关系;系统底层使用Neo4j作为知识图谱数据库存储和管理知识图谱数据,开发工具类管理与Neo4j进行连接,实现查询、修改、删除、新增操作的封装;选择AntV-G6作为前端可视化框架用于图谱数据的展示;所述更新和优化所述第一知识图谱和所述第二知识图谱包括,通过实体识别对新数据进行扫描,当识别到新实体时对比新实体与现有实体,若所述新实体与现有实体不同,则为所述新实体分配一个全局唯一的标识符,根据新实体的属性抽取新实体与现有实体间的关系,并将新实体融合到所述第一知识图谱或所述第二知识图谱中;若所述新实体与现有实体重复,检测现有实体的属性变更,在所述第一知识图谱或所述第二知识图谱中定位对应的现有实体并更新实体的属性,并为变更的属性创建历史记录;利用深度学习模型从新数据中识别出实体间的新关系,若新关系在所述第一知识图谱或所述第二知识图谱中不存在,则对新关系的类型和属性进行归一化处理并将新关系融合到所述第一知识图谱或所述第二知识图谱中;若新关系在所述第一知识图谱或所述第二知识图谱中已存在,检测现有关系的权重和属性变更,在所述第一知识图谱或所述第二知识图谱中定位到对应的现有关系,并更新现有关系属性和权重,关系的权重更新表示为, 其中,Wu表示更新后的关系权重,Wc表示现有关系的权重,λ表示控制权重更新的步长的学习率,ΔW表示权重的变化幅度,τ表示变化幅度的阈值,σγ·Gi表示根据门控计算的置信度,γ表示调节置信度对权重更新影响的参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人朗坤智慧科技股份有限公司,其通讯地址为:210005 江苏省南京市鼓楼区汉中路2号亚太商务楼31层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。