Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于spark的数据指标动态计算和拉宽方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明公开了一种基于spark的数据指标动态计算和拉宽方法和系统;本发明涉及电数据处理技术领域;创建视图配置信息表、原子指标配置信息表和衍生指标配置信息表。初始化配置信息表,包括视图名称、作业编号、计算逻辑、依赖关系等。启动Spark,加载线上三张配置信息表至内存。根据传入的job名称,查询视图配置信息表,获取该job下所有视图的构建逻辑和缓存级别。本发明通过配置化管理,实现了视图、原子指标和衍生指标的灵活构建与计算,减少了重复编码工作,缩短了开发周期。利用Spark等大数据处理框架的并行计算能力,优化了资源使用,提高了数据处理速度。

主权项:1.一种基于spark的数据指标动态计算和拉宽的方法,其特征在于,包括如下步骤:S1,创建并初始化视图配置信息表、原子指标配置信息表和衍生指标配置信息表,启动Spark,加载线上三张配置信息表至内存;根据传入的job名称,查询视图配置信息表,获取该job下所有视图的构建逻辑和缓存级别;S2,读取原子指标配置信息表,找出所有线上原子指标的计算逻辑集合;确定每个原子指标所依赖的视图;S3,利用异步多线程并行触发Spark任务,同时计算多个原子指标;然后将所有原子指标的计算结果写入Hive三级分区表中;S4,读取原子指标配置信息表和衍生指标配置信息表,找到该job对应的原子指标和衍生指标的集合;生成该job的原子指标视图作为子查询同时根据宽表元数据信息字段及顺序,遍历并生成衍生指标的计算逻辑执行衍生指标的计算,并将结果存储至相应的Hive分区表中;S5,通过Spark程序进行计算形成线上指标宽表和线下指标的查询语句,生成线下汇总层指标宽表并进行全连接操作,生成全量指标集合后写入最终的指标汇总表。

全文数据:

权利要求:

百度查询: 北京白龙马云行科技有限公司 一种基于spark的数据指标动态计算和拉宽方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。