首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

数据索引建立、数据检索方法、装置、设备和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明公开了一种数据索引建立、数据检索方法、装置、设备和存储介质。本发明在数据索引建立过程中,首先根据不同数据量级别的数据集合,选择不同的分段聚类模型对数据集合中数据样本进行一次聚类,得到不同的一类聚类中心,其次利用与一类聚类中心关联的量化器进行二次聚类,得到不同的二类聚类中心,并基于不同的二类聚类中心得到索引表;而在数据检索过程中,利用数据索引建立过程得到的索引表进行图像数据检索。本发明预先对海量样本数据进行多次的分段聚类并建立索引,提高了聚类效果以及聚类中心的精度;同时在数据检索过程中,基于预先建立的索引,实现了高精准度、高效率地图像数据检索。

主权项:1.一种数据索引建立方法,其特征在于,包括:根据数据集合的数据量级别,获取与所述数据量级别关联的分段聚类模型;将所述数据集合中所有数据样本输入至所述分段聚类模型中,接收所述分段聚类模型输出的N个一类聚类中心;N为正整数;自所述数据集合中读取所述数据样本,将读取的所述数据样本归入至距离最近的所述一类聚类中心,并将N个量化器分别与N个一类聚类中心一一对应关联;对与各所述量化器关联的所述数据样本进行二次聚类,确定二类聚类中心以及与各所述二类聚类中心关联的所述数据样本;建立与N个所述量化器对应的N个索引表;每一个所述索引表中包含至少一项索引,每一项索引包括一个二类聚类中心和与该二类聚类中心关联的所有所述数据样本;所述根据数据集合的数据量级别,获取与所述数据量级别关联的分段聚类模型之前,包括:获取数据集合中包含的数据样本的数据量,并将所述数据量输入至预设的输出模型中;接收所述输出模型输出的数据量级别,并确定出所述数据集合的数据量级别;所述数据集合的数据量级别为初始级别、第一级别、第二级别、第三级别、第四级别和第五级别,各数据量级别对应数据集合的数据量分别为十万、二十万、四十万、八十万、一百六十万和三百二十万;所述将所述数据集合中所有数据样本输入至所述分段聚类模型中,接收所述分段聚类模型输出的N个一类聚类中心,包括:利用所述分段聚类模型,自所有所述数据样本中确定出预选数量的所述数据样本以及对应的特征向量;利用分段聚类模型对每一个所述特征向量根据维度进行分段,以形成每一个所述特征向量中各段对应的分段向量;利用分段聚类模型分别对每一个特征向量中各个相同段对应的所述分段向量进行聚类,确定出各段对应的K个一类聚类中心;K为正整数;根据各段对应的K个所述一类聚类中心,确定出所述分段聚类模型输出的N个一类聚类中心。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 数据索引建立、数据检索方法、装置、设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。