首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

核电站生产数据多数源合一的数据清洗方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中核核电运行管理有限公司

摘要:本公开属于核电技术领域,具体涉及一种核电站生产数据多数源合一的数据清洗方法及装置。本公开提供的技术方案中,可自动根据业务对象的数据模型及相似度评估算法进行同业务对象多数据源的数据整合,并最终形成整合后的业务对象数据,数据使用者可直接选取整合后的数据进行相关数据应用。核电站可根据自身各业务对象的数据标准,整合多信息系统数据,形成生产相关的生产数据数据资源服务。

主权项:1.一种核电站生产数据多数源合一的数据清洗方法,其特征在于,所述方法包括:步骤10,获取多个数据源的业务对象和业务对象的数据;步骤20,对获取到的多个业务对象进行相似度评估,确定相同的业务对象;步骤30,对相同的业务对象的数据进行相似度评估,确定相同的数据;步骤40,将相同的业务对象的相同的数据进行清洗合并;步骤20包括:步骤200,分析从各数据源抽取出的业务对象,解析各业务对象的唯一性标识;步骤201,针对存在唯一性标识的业务对象,将唯一性标识相同的多个业务对象作为相同的多个业务对象;步骤202,针对不存在唯一性标识的业务对象,根据数据标准将该业务对象的多个属性组合成为该业务对象的组合标识;步骤203,将组合标识相同的多个业务对象作为相同的多个业务对象;所述方法还包括:步骤204,对各需参与比较的业务对象的组合标识进行分词处理,得到各业务对象的关键词,将各业务对象的关键词进行标签化存储;步骤205,计算每个业务对象的各关键词的词频,并写入词频向量值,得到每个业务对象的特征向量;步骤206,判断各业务对象的特征向量的相似度,将特征向量相似度符合预设条件的业务对象确定为相同的业务对象。

全文数据:

权利要求:

百度查询: 中核核电运行管理有限公司 核电站生产数据多数源合一的数据清洗方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。