恭喜洛阳师范学院马友忠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜洛阳师范学院申请的专利基于距离划分树的高维数据相似性连接查询方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN108829804B 。
龙图腾网通过国家知识产权局官网在2025-05-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:201810577221.3,技术领域涉及:G06F16/2453;该发明授权基于距离划分树的高维数据相似性连接查询方法及装置是由马友忠;张瑞玲;林春杰;李莹设计研发完成,并于2018-06-05向国家知识产权局提交的专利申请。
本基于距离划分树的高维数据相似性连接查询方法及装置在说明书摘要公布了:本发明实施例提供一种基于距离划分树的高维数据相似性连接查询方法及装置。方法包括获取高维的原始数据,并将原始数据映射到一维空间;根据第一距离阈值及卡方分布性质确定第二距离阈值,根据原始数据和第二距离阈值构建距离划分树;遍历距离划分树并对距离划分树中的各节点进行比较获得候选相似节点对集合;计算候选相似节点对集合中各候选相似节点对包括的原始数据之间的原始距离,并将原始距离与第一距离阈值进行比较获得相似性查询结果。装置用于执行方法,本发明实施例通过将高维原始数据映射到一维空间降低了计算的复杂度,通过距离划分树可以以较低的代价找到候选结果,增强了过滤效果,从而大大提高查询效率。
本发明授权基于距离划分树的高维数据相似性连接查询方法及装置在权利要求书中公布了:1.一种基于距离划分树的高维数据相似性连接查询装置,其特征在于,用于从高维数据集合中查询数据间的相似性,所述高维数据集合中的数据为图形图像、视频、轨迹或时间序列,所述装置包括:映射模块,用于获取所有待查询的高维的原始数据,并将所述原始数据映射到一维空间;距离划分树构建模块,用于根据预设的第一距离阈值及卡方分布性质确定第二距离阈值,根据所述一维空间中的所述原始数据和所述第二距离阈值构建距离划分树;候选相似节点对集合获取模块,用于遍历所述距离划分树,并对所述距离划分树中的各节点进行比较,获得候选相似节点对集合;比较模块,用于计算所述候选相似节点对集合中各候选相似节点对包括的原始数据之间的原始距离,并将所述原始距离与所述第一距离阈值进行比较,获得相似性查询结果;其中,所述映射模块具体用于:将所述原始数据v与a进行点积运算,进而将所述原始数据映射到一维空间,其中,向量a的每一个元素都服从标准正态分布N0,1的独立、同分布随机变量;所述距离划分树构建模块,具体用于:从所述原始数据中随机获取原始数据子集,根据所述原始数据子集构建对应的初始距离划分树;对所述初始距离划分树按照预设规则进行扩展,获得所述距离划分树;其中,所述预设规则包括:对所述初始距离划分树中的第一层子节点进行扩展;若所述初始距离划分树中的第一层最左边子节点的编号大于1,则生成一个虚拟子节点;在所述初始距离划分树中的第一层最右边生成一个虚拟子节点;若判断获知所述初始距离划分树中的第一层的所述子节点的编号非连续,则在非连续编号的两个子节点中间生成一个虚拟子节点;所述距离划分树构建模块,具体用于:根据所述原始数据子集构建根节点;将所述原始数据子集映射到一维空间,并根据所述第二距离阈值对所述一维空间进行等宽划分,获得所述根节点对应的多个子节点;计算各原始数据子集在所述一维空间的映射值π1vi,根据所述映射值和所述第二距离阈值计算各原始数据对应的所述子节点的编号:其中ε为所述第一距离阈值;若判断获知所述子节点的编号不存在,则生成对应编号的新子节点;如果已经存在,则将vi插入到节点pid中,并将数量count值增加1;若判断获知所述子节点中所述原始数据子集的个数大于预设阈值,则根据所述子节点的距离范围对所述子节点进行再次划分,直至所述子节点中的原始数据子集的个数小于或等于所述预设阈值,获得初始距离划分树;距离划分树节点的数据结构为:在距离划分树中每一个节点,包括父亲节点和叶子节点,都包含有该节点所在level,层内编号orderNo,数据个数count和对应的数据集合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人洛阳师范学院,其通讯地址为:471000 河南省洛阳市伊滨区吉庆路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。