首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

企业信息管理方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津建设发展集团股份公司

摘要:本发明提供一种企业信息管理方法及系统,涉及信息管理技术领域,包括根据预设的企业信息分类体系,采集企业内部和外部的结构化数据和非结构化数据,分别进行预处理,得到标准结构化信息,将标准结构化信息映射到本体概念,形成初始企业知识图谱;学习概念和关系的低维嵌入表示,对概念和关系的低维嵌入表示进行联合优化,计算优化后的概念向量和关系向量之间的语义相似度,根据预设的相似度阈值对概念向量和关系向量进行融合,将融合后的企业知识图谱存储到预先构建的图数据库中,管理人员输入信息需求,根据信息需求调用相应的图查询和分析算法,在存储于图数据库中的企业知识图谱上计算并返回企业信息查询结果,并在交互界面上可视化展示。

主权项:1.一种企业信息管理方法,其特征在于,包括:根据预设的企业信息分类体系,采集企业内部和外部的结构化数据和非结构化数据,分别对所述结构化数据和非结构化数据进行预处理,得到标准结构化信息,根据预先构建的企业信息本体模型,将所述标准结构化信息映射到本体概念,形成初始企业知识图谱;针对初始企业知识图谱,学习概念和关系的低维嵌入表示,对概念和关系的低维嵌入表示进行联合优化,得到优化后的概念向量和关系向量,所述联合优化指在学习概念嵌入表示时,同时利用与概念嵌入表示相连的关系信息,使概念嵌入向量能够捕捉关系的语义;在学习关系嵌入表示时,同时利用与学习关系嵌入表示相连的概念信息,使关系嵌入向量能够捕捉概念的语义,计算优化后的概念向量和关系向量之间的语义相似度,根据预设的相似度阈值对概念向量和关系向量进行融合,得到融合后的企业知识图谱;将融合后的企业知识图谱存储到预先构建的图数据库中,管理人员通过图形化交互界面输入信息需求,根据信息需求调用相应的图查询和分析算法,在存储于图数据库中的企业知识图谱上计算并返回企业信息查询结果,并在交互界面上可视化展示;根据预先构建的企业信息本体模型,将所述标准结构化信息映射到本体概念,形成初始企业知识图谱包括:基于预先构建的企业信息本体模型,对得到的标准结构化信息进行语义编码,得到结构化编码信息;采用基于语义学习的命名实体识别模型和关系抽取模型对结构化编码信息进行处理,得到候选概念词和各概念词之间的关系;获取候选概念词的语义表示特征和共现关系特征,通过聚类算法对候选概念词的语义表示特征和共现关系特征进行聚类,形成初始概念体系,基于初始概念体系,利用各概念词之间的关系构建概念的层次结构,得到目标概念体系;通过人机交互方式对目标概念体系进行审核优化,通过可视化界面对目标概念体系进行调整,得到最终的企业信息本体概念体系,根据最终的企业信息本体概念体系形成初始企业知识图谱;构建企业信息本体模型包括:利用预训练的词嵌入模型计算企业知识图谱中概念节点的文本描述之间的相似度,并通过设定相似度阈值构建候选正样本对和候选负样本对,从候选正样本对和负样本对中随机采样,构建平衡的正负样本对数据集;基于平衡的正负样本对数据集,引入相似度分布参数,构建相似度损失函数,通过最小化正样本对的距离和最大化负样本对的距离,更新概念节点对;将所述相似度损失函数与企业信息本体模型的损失函数进行联合优化,得到融合损失函数,并使用梯度下降优化算法最小化所述融合损失函数,训练得到最终的企业信息本体模型;构建相似度损失函数包括:将平衡的正负样本对数据集中的正样本对视为锚点和正样本,负样本对视为锚点和负样本,引入相似度分布参数,构建衡量正负样本对相似度的损失函数,其计算公式如下: ;其中,L1表示相似度损失函数,a表示锚点节点,p表示正样本节点,τ表示相似度分布参数,sim·表示节点之间的相似度度量,N表示负样本的数量,nt表示第t个负样本节点;企业信息本体模型的损失函数的计算公式如下: ;其中,L2表示企业信息本体模型的损失函数,h表示头概念,r表示关系,t表示尾概念,h,r,t表示知识图谱中的正三元组,h',r,t'表示负三元组,S表示正三元组集合,S'表示负三元组集合,γ表示边际超参数,d·表示嵌入空间距离度量函数,h+r,t表示正三元组的头尾概念之间的关系,h'+r,t'表示负三元组的头尾概念之间的关系,[·]+表示取正部分;计算优化后的概念向量和关系向量之间的语义相似度,根据预设的相似度阈值对概念向量和关系向量进行融合,得到融合后的企业知识图谱包括:根据融合前、后的概念向量和关系向量,构建相似度阈值调整的目标函数,基于相似度阈值调整的目标函数,在融合概念向量和关系向量的过程中,动态调整相似度阈值;对当前概念向量和关系向量表示计算不同相似度阈值下融合后的知识图谱,并基于所述目标函数计算不同阈值下的目标函数值,选择目标函数值最优的相似度阈值作为当前训练批次的最优阈值;利用所述最优阈值对当前训练批次的概念向量和关系向量进行融合,得到初始企业知识图谱,通过梯度下降算法最小化所述相似度阈值调整的目标函数,得到最优的相似度阈值;利用最优相似度阈值对优化后的概念向量和关系向量进行融合,得到融合后的企业知识图谱;构建相似度阈值调整的目标函数公式如下: ;其中,E表示优化前的概念和关系嵌入表示,Eθ表示相似度阈值为θ时优化后的嵌入表示,θ表示相似度阈值,i表示概念,j表示关系,hi表示优化前概念i的嵌入向量,表示相似度阈值为θ时优化后概念i的嵌入向量,rj表示优化前关系j的嵌入向量,表示相似度阈值为θ时优化后关系j的嵌入向量。

全文数据:

权利要求:

百度查询: 天津建设发展集团股份公司 企业信息管理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。