首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于ODBC访问的数据库比较方法 

申请/专利权人:中国人民解放军63686部队

申请日:2020-07-08

公开(公告)日:2024-07-05

公开(公告)号:CN111966660B

主分类号:G06F16/21

分类号:G06F16/21;G06F16/22;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.07.05#授权;2020.12.08#实质审查的生效;2020.11.20#公开

摘要:本发明涉及一种基于ODBC访问的数据库比较方法。该方法基于ODBC访问技术,主要用于两个关系型数据库的结构、内容的比较。该方法由四个部分组成,共同构成了一种基于ODBC访问的数据库比较方法。四个部分分别为一种扩展的的文本相似度计算方法、一种基于加权优选的格式化文本比较方法、基于ODBC访问的数据库内容比较方法和基于ODBC访问的数据库比较方法。本发明可以实现与数据库厂商无关的数据库比较方法,比较结果为较优方案,可以在关系型数据库所涉及领域进行应用。

主权项:1.一种基于ODBC访问的数据库比较方法,其特征在于该方法的输入数据为两组数据库的连接信息,通过ODBC访问技术获取数据库内容,输出信息为两组数据库表的比较结果,具体包括以下步骤:步骤1、建立ODBC连接,初始化比较环境;步骤2、获取数据库表字段信息和数据库表内容;步骤3、针对每个表进行构造格式化文本,计算数据库表结构的比较结果,若整体相似度为小于1,则该表比较结果为不同,继续下一个表比较,否则转到步骤4,在对于每个表构造的格式化文本采用基于加权优选的格式化文本比较方法进行比较,该方法的输入内容为两组格式化的文本Rx、Ry和比较参数Spx和Spy,其中比较参数Spx和Spy分别包括比较列和关键列,输出内容为基于最优比较策略的两组格式化文本、每行格式化文本的比较相似度和整体相似度;所述的采用基于加权优选的格式化文本比较方法包括以下步骤:步骤3.1整理数据,初始化比较环境;验证比较参数Spx和Spy一致性,Spx与Rx、Spy与Ry匹配性,如果不匹配,直接返回错误;分配相似度矩阵空间;若Rx长度小于Ry长度,则对两组文本进行交换;步骤3.2对于需要比较的数据列,采用一种扩展的文本相似度计算方法计算比较单元的相似度;对于Rx的每一行Rx[i]和Ry的每一行Ry[j],做如下循环:对于输入的每一比较列Spx[k]和Spy[l],采用一种扩展的文本相似度计算方法计算文本Rx[i][Spx[k]]和Ry[j][Spy[l]]相似度,并将每一比较列相似度相加;对于输入的每一关键列Spx[k]和Spy[l],采用一种扩展的文本相似度计算方法计算文本Rx[i][Spx[k]]和Ry[j][Spy[l]]相似度,并将每一关键列相似度相加;将比较列相似度与关键列相似度进行加权求和得到Sij,其中 式中s1和s2分别为比较列相似度和关键列相似度,lenspx和lenspx'分别为比较列个数和关键列个数;步骤3.3构造两组格式化文本相似度矩阵;将步骤3.2中的每组相似度数据Sij,形成相似度矩阵S[i][j]=Sij,0≤i<lenRx,0≤j<lenRy;对于相似度矩阵S,将所有元素均标记为未查找,依次按照步骤3.4进行操作;步骤3.4查找并排序每行文本的最优比较策略;查找相似度矩阵S中的最大未标记元素,并记录当前位置的行列序号i,j,并标记矩阵的第i行、第j行、第i列、第j列均为已查找,若当前矩阵S中未标记行数为0或者未标记列数为0,转到步骤3.5,否则继续进行步骤3.4;步骤3.5输出比较策略和文本相似度;将所记录的行列号i,jh,h=1,2,...lenRy按照i大小进行排序,得到格式化文本的最优比较策略RlenRy*2,依次将文本Rx中第Ri,1行与文本Ry中第Ri,2行进行比较i=1,2,...lenRy,比较后整体相似度最高,相似度值为整体相似度值步骤4针对每个表计算数据库表内容的比较结果,若比较结果相同,则该表比较结果为相同,否则该表比较结果为不同。

全文数据:

权利要求:

百度查询: 中国人民解放军63686部队 一种基于ODBC访问的数据库比较方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。