Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于语义识别的核电厂布置设计本体关联可视化方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种基于语义识别的核电厂布置设计本体关联可视化方法。采集各个核电布置设计平台的布置设计文本,通过自然语言处理建立核电领域特征词典;利用TextRank算法从核电领域特征词典提取核电厂布置设计关键词,组建核电厂布置设计关键词集合;对核电厂布置设计关键词之间关系识别;根据核电厂布置设计关键词和关系识别结果,对布置设计文本对应的核电厂布置设计本体关联建模,最后进行布置关系的可视化。本发明方法,针对核电厂布置设计中布置关系的自身特点,基于语义识别的方法实现核电厂布置设计中布置关系多源非结构化数据的布置设计文本预处理、布置设计关键词提取、关键词之间关系识别,实现布置设计本体可视化表示。

主权项:1.一种基于语义识别的核电厂布置设计本体关联可视化方法,其特征在于:所述方法依次包括以下步骤:步骤一:采集各个核电布置设计平台中的文本数据作为布置设计文本,对布置设计文本预处理,建立核电领域特征词典;步骤二:利用TextRank算法从核电领域特征词典提取核电厂布置设计关键词,组建核电厂布置设计关键词集合;步骤三:对核电厂布置设计关键词集合中的核电厂布置设计关键词之间关系进行识别,识别分为分类关系与非分类关系;步骤四:根据前面步骤中抽取的核电厂布置设计关键词以及核电厂布置设计关键词间的关系识别结果,对布置设计文本对应的核电厂布置设计本体关联建模,利用建模获得的模型进行布置关系的可视化;所述步骤二中,具体为:S2.1、利用TextRank算法先根据核电领域特征词典中的词与词之间的共现关系构建词图;词图中,以一个词作为节点而形成词节点,词节点之间的边代表了两个词之间的共现关系;S2.2、采用BERT方法对核电领域特征词典处理生成器中每个词的词向量作为布置设计文本的词向量,采用AP聚类算法对词向量进行相似度聚类,获得各个簇Cj;按照以下公式先计算每个词节点vj的语义聚类重要度wcvj,进而再根据语义聚类重要度wcvj得到词节点间语义聚类重要度跳转概率如下式所示: 上式中,表示词节点vj的所在簇Cj的簇聚类中心的向量;wcvi表示词节点vi的语义聚类重要度,表示词节点vj到所在簇Cj的簇聚类中心的向量,Cj表示词节点vj的所在簇;表示词节点vj和词节点vi之间语义聚类重要度的跳转概率;Outvj表示所有词节点vj指向的词节点的集合;S2.3、按照以下公式先计算每个词节点vj的统计重要度wsvj,进而再根据统计重要度wsvj得到词节点间统计重要度跳转概率如下式所示:wsvj=σj×tfjg×idfj 上式中,σj表示词节点vj的词频波动程度,tfjg表示词节点vj的词频,idfj表示词节点vj的逆文档频率;wsvi表示词节点vi的语义聚类重要度,表示词节点vj和词节点vi间统计重要度跳转概率;S2.4、计算语义聚类重要度跳转概率与统计重要度跳转概率的加权和获得词节点跳转概率: α1+β1=1其中,pji表示词节点vj和词节点vi间词节点跳转概率,α1、β1分别为语义聚类重要度、统计重要度的影响比例系数;S2.5、将词节点跳转概率pji带入以下公式计算各个词节点的权重WSvi,如下式所示: 上式中,d为阻尼系数,表示词节点之间的指向概率;WSvi表示词节点vi的权重,wji是词节点vj和词节点vi之间边的权重,Invi表示所有指向单词节点vi的词节点集合,Outvj表示所有词节点vj指向的词节点集合;S2.6、各个词节点的权重WSvi进行排序,排序后取前面K个词作为词节点的核电厂布置设计关键词,构成核电厂布置设计关键词集合。

全文数据:

权利要求:

百度查询: 浙江大学 基于语义识别的核电厂布置设计本体关联可视化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。