首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多维离散数据指纹的数据行为追溯方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国电子科技集团公司第三十研究所

摘要:本发明涉及数据追溯技术领域,公开了一种基于多维离散数据指纹的数据行为追溯方法,包括以下步骤:S1,多维离散数据指纹提取:构建数据标识模型,然后面对数据标识模型结构提取多维离散数据指纹,组装成数据标识;S2,数据行为溯源:对拟溯源对象,根据步骤S1提取的数据标识对多维离散数据指纹进行计算,提取相似度信息,确定原始数据之间的血缘关系,计算数据行为。本发明解决了现有技术存在的追溯精准度较低等问题。

主权项:1.一种基于多维离散数据指纹的数据行为追溯方法,其特征在于,包括以下步骤:S1,多维离散数据指纹提取:构建数据标识模型,然后面对数据标识模型结构提取多维离散数据指纹,组装成数据标识;S2,数据行为溯源:对拟溯源对象,根据步骤S1提取的数据标识对多维离散数据指纹进行计算,提取相似度信息,确定原始数据之间的血缘关系,计算数据行为;步骤S1中,多维离散数据指纹包括库表类数据和文档类数据,面对库表类数据和文档类数据分别提取数据标识;步骤S1中,对库表类数据提取数据标识时,对原始库表类数据进行标识提取,包括以下步骤:S1AX1,读取库表结构:获取数据库的库表结构;S1AX2,构建库表从属关系:根据访问路径对获取的库表结构进行重组,建立库、表、列之间的结构关系,并根据预置的字典库映射或使用人工标注的方式加入对库名、表名、列表的备注;S1AX3,计算离散数据指纹;S1AX4,组装数据指纹:按照数据标识模型对离散数据指纹进行组装;S1AX5,计算数据相似度:根据离散数据指纹及关联关系,分别计算对应库、表、列、行之间的数据相似度;S1AX6,生成血缘关系:根据数据相似度计算结果,构建数据血缘关系;S1AX7,存储数据标识:根据数据血缘关系结构,记录本数据和前序数据的血缘关系,以表为维度形成数据标识,并进行存储;步骤S2中,获取拟溯源的对象,判定数据是库表类数据还是文档类数据,分别进行处理,包括以下步骤:S2AX1,比对库表类数据的数据相似度,步骤S2AX1包括以下步骤:S2AX11,计算数据指纹,提取关键词:对行数据、列数据、表数据、库数据,分别进行计算数据指纹,获取关键词信息;S2AX12,比对标识库:根据行数据、列数据、表数据、库数据,分别和标识库中的数据指纹进行比对;S2AX13,计算数据相似度:根据余弦相似度比对关键词库信息;S2AX2,比对文档类数据的数据相似度,步骤S2AX2包括以下步骤:S2AX21,提取数据标识:提取文档的数据标识信息;S2AX22,比对标识库:将提取的数据标识与数据标识库中的标识进行比对;S2AX23,计算数据相似度:分别计算不同数据指纹的相似度信息;S2AX3,进行相似度加权:对各数据相似度结果进行加权;S2AX4,进行阈值判定:将相似度结果与阈值进行比对;S2AX5,确定血缘关系:确定原始数据之间的血缘关系;S2AX6,计算溯源结果:根据血缘关系和日志分析结果,获取数据行为溯源结果。

全文数据:

权利要求:

百度查询: 中国电子科技集团公司第三十研究所 一种基于多维离散数据指纹的数据行为追溯方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。