买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京恒祐科技有限公司
摘要:本发明涉及数据处理技术领域,具体涉及一种基于云计算的金融数据分布式存储方法,包括:获取多个一维数据集,得到多个数据序列与每个数据的对应主成分值;构建四维坐标系,将数据序列映射到四维坐标系内,得到每个维度的数据趋势差异性;对数据点进行聚类,得到多个类簇;根据每个维度的数据趋势差异性,得到每个类簇不进行优化的可能性,得到待划分类簇、不划分类簇与待划分的分裂连通图;根据每个类簇不进行优化的可能性,得到每个待划分类簇的分裂阈值,得到最终聚类结果,对金融数据进行存储。本发明旨在解决通过连通图分裂聚类算法对数据点进行聚类时,分裂连通图内数据点的分布对聚类结果造成影响的问题。
主权项:1.一种基于云计算的金融数据分布式存储方法,其特征在于,该方法包括以下步骤:在金融数据库中,获取多个维度的一维数据集,所述一维数据集中每个维度数据对应一个相关日期;根据每个维度数据对应的相关日期,得到多个数据序列;以相关日期、数值为坐标轴,构建二维坐标系,得到每个维度数据的对应主成分值;以每个维度为坐标轴,构建四维坐标系,根据每个维度数据的对应主成分值与四维坐标系内数据点的分布,得到每个维度的数据趋势差异性;对四维坐标系内的数据点进行聚类,得到多个类簇、多个分裂连通图、每个分裂连通图与相邻分裂连通图之间断裂节点的长度;根据每个数据点对应数据序列内的各维度数据及每个维度的数据趋势差异性,得到每个数据点的整体趋势差异性;根据每个类簇内每个数据点的整体趋势差异性与含有数据点的个数,得到每个类簇不进行优化的可能性,得到待划分类簇、不划分类簇与待划分的分裂连通图;根据每个类簇不进行优化的可能性、每个分裂连通图与相邻分裂连通图之间断裂节点的长度,得到每个待划分类簇的分裂阈值;根据每个待划分类簇的分裂阈值,得到最终聚类结果,并对金融数据进行存储;所述对四维坐标系内的数据点进行聚类,得到多个类簇、多个分裂连通图、每个分裂连通图与相邻分裂连通图之间断裂节点的长度,包括的具体方法为:以欧式距离为距离度量,通过连通图分裂聚类算法,对四维坐标系内的数据点进行连通图构建,得到构造连通图,进一步得到若干分裂连通图;其中每个分裂连通图对应一个类簇;将构造连通图中,每个分裂连通图与其他分裂连通图相连节点的长度,记为断裂节点长度,得到每个分裂连通图的断裂节点长度集;将任意一个分裂连通图的断裂节点长度集内的断裂节点长度的数值出现的次数,记为构造连通图中该分裂连通图与其他分裂连通图相连节点长度的次数;在构造连通图中有节点相连的分裂连通图,互为相邻分裂连通图,得到每个分裂连通图的相邻分裂连通图;所述根据每个数据点对应数据序列内的各维度数据及每个维度的数据趋势差异性,得到每个数据点的整体趋势差异性,包括的具体方法为: 式中,δa,b表示第a个类簇内第b个数据点的整体趋势差异性,m表示维度个数,δd表示第d个维度的数据趋势差异性,la,b,d表示第a个类簇内第b个数据点对应第d个维度数据的对应主成分值;所述根据每个类簇内每个数据点的整体趋势差异性与含有数据点的个数,得到每个类簇不进行优化的可能性,得到待划分类簇、不划分类簇与待划分的分裂连通图,包括的具体方法为: 式中,Ca表示对第a个类簇不进行优化的可能性,δa,b表示第a个类簇内第b个数据点的整体趋势差异性,表示第a个类簇内所有数据点的整体趋势差异性的均值,表示第a个类簇内每个数据点的整体趋势差异性与所有数据点的整体趋势差异性的均值的差值绝对值的最大值,Na表示第a个类簇内所含数据点的数量,norm表示归一化函数,||表示绝对值函数,exp表示以自然常数为底的指数函数;预设可能性阈值T5,将不进行优化的可能性小于T5的类簇,记为待划分类簇,不进行优化的可能性大于或等于T5的类簇,记为不划分类簇;将与待划分类簇对应的分裂连通图,记为待划分的分裂连通图;所述根据每个类簇不进行优化的可能性、每个分裂连通图与相邻分裂连通图之间断裂节点的长度,得到每个待划分类簇的分裂阈值,包括的具体方法为: 式中,LFw,r表示以断裂节点长度L1,w,r为第w个待划分类簇的分裂阈值的可信性,L1,w,r表示第w个待划分的分裂连通图的断裂节点长度集中的第r个断裂节点长度,Nw,r表示断裂节点长度L1,w,r为构造连通图中第w个待划分的分裂连通图与相邻分裂连通图相连节点长度的次数,CEw表示对第w个待划分类簇不进行优化的可能性,CEw,r,y表示构造连通图中与第w个待划分的分裂连通图的节点相连且相连节点长度为L1,w,r的分裂连通图对应的类簇不进行优化的可能性;将任意一个待划分类簇的所有断裂节点长度为该待划分类簇的分裂阈值的可信性最大的断裂节点长度,作为该待划分的分裂连通图的分裂阈值。
全文数据:
权利要求:
百度查询: 北京恒祐科技有限公司 一种基于云计算的金融数据分布式存储方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。