买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:杭州茼久网络科技有限公司
摘要:本发明公开了基于大数据的人工智能数据聚合方法,涉及数据聚合技术领域,包括基于数据类型收集数据进行预处理,构建时空索引,进行空间索引并提取时间周期性特征;根据时空索引,分析数据点的概率密度和空间自相关性。本发明所述方法通过空间索引数据能够根据地理位置快速检索,通过提取时间周期性特征,能够识别数据在时间上的变化模式和周期性,结合空间索引和时间特征提取的结果,能够实现更加精准和全面的数据聚合,通过使用核密度估计方法,可以对每个数据点的密度进行精确的估算,有助于识别数据中的密集和稀疏区域,使得在高密度区域和低密度区域能够动态调整聚类参数,提高聚类的灵活性和精确度。
主权项:1.基于大数据的人工智能数据聚合方法,其特征在于:包括,基于数据类型收集数据进行预处理,构建时空索引,进行空间索引并提取时间周期性特征;根据时空索引,分析数据点的概率密度和空间自相关性;通过概率密度和空间自相关性设置自适应聚类参数进行聚类,对聚类后的数据进行时空自适应聚合;定期更新数据并计算新的聚合结果,传输到云端进行存储;所述基于数据类型收集数据进行预处理,包括,基于数据类型收集数据,收集数据类型k中的数据点信息包含空间坐标,以及数据点的数据值包括传感器数据、用户行为数据和环境数据;针对收集到的数据,进行统一处理和分析,计算每个数据类型数据的均值和标准差,将各类型数据进行标准化处理;所述构建时空索引,进行空间索引并提取时间周期性特征,包括,基于标准化后的数据值,构建时空索引,通过四叉树算法进行空间索引,并使用傅里叶变换提取时间周期性特征,表示为: ; ;其中表示四叉树结构,表示第i个数据点,表示数据点i的x坐标,表示数据点i的y坐标,表示第i个数据点的数据值,表示第k类数据在时间t上的特征,表示第n时间第k类数据的数据值,表示第k类数据的总时间点数,表示第k类数据的周期,N表示所有数据点的总数,表示为虚数单位;所述根据时空索引,分析数据点的概率密度函数和空间自相关性,包括,对第i个数据点的数据值使用核函数计算其密度贡献,对所有数据点的密度贡献进行求和并标准化,计算数据点的概率密度函数,表示为: ;其中表示数据点处的密度估计值,c表示数据点的数据总数,h表示核密度估计的带宽参数,K表示高斯核函数,表示第j个数据点的数据值;通过Moran'sI空间自相关系数,测量数据点的空间自相关性,表示为: ;其中I表示空间自相关系数,N表示数据点总数,表示空间相邻矩阵的元素,表示权重矩阵的总和,表示数据点的平均值;所述通过概率密度和空间自相关性设置自适应聚类参数进行聚类,包括,根据数据点处的核密度估计和Moran'sI的结果,初步设置自适应聚类参数,表示为: ; ;其中表示第i个数据点的领域半径,表示数据点处的密度估计值,表示第i个数据点的最小点数;应用AD-DBSCAN算法对数据进行聚类,表示为: ;其中表示第k类数据的聚类结果,表示第k类数据点领域半径集合,表示第k类数据的最小点数集合,表示第k类数据的标准化数据集合;所述对聚类后的数据进行时空自适应聚合,包括,对聚类后的数据进行时空自适应聚合,表示为: ; ; ;其中表示第k类数据类型的聚合结果,第k类数据的数据点总数,表示第k类数据第i个数据点的权重,表示第k类数据第i个数据点的值,表示第k类数据第i个数据点的时间周期特征,表示为数据点i和k之间的距离,表示空间权重的带宽参数;通过经验法则对于空间数据计算带宽参数,表示为: ;其中和分别表示数据点之间的最大和最小距离,v标识数据点数量。
全文数据:
权利要求:
百度查询: 杭州茼久网络科技有限公司 基于大数据的人工智能数据聚合方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。