买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:河南中原消费金融股份有限公司
摘要:本发明公开了一种基于Spark逻辑执行计划的实时数据血缘分析方法及系统,方法包括:SQL捕获与消息传递,从多个计算引擎实时捕获正在执行的SQL语句,并将捕获的SQL语句及其来源引擎信息作为消息发送至消息队列中;SQL语法转换,从消息队列中接收并转换SQL语句;SparkSession构建与逻辑执行计划生成,在解析服务中构建并配置SparkSession;利用构建的SparkSession,将转换后的SQL语句解析为逻辑执行计划;血缘关系解析,对生成的逻辑执行计划进行遍历解析,获取完整的血缘关系数据;血缘数据存储。通过与具体的计算引擎高度解耦,无需在这些引擎中安装解析插件或修改其配置,避免了因系统变更可能引入的稳定性隐患,减少了依赖特定引擎内部机制而导致的兼容性问题。
主权项:1.一种基于Spark逻辑执行计划的实时数据血缘分析方法,其特征在于,包括以下步骤:SQL捕获与消息传递,从多个计算引擎实时捕获正在执行的SQL语句,并将捕获的SQL语句及其来源引擎信息作为消息发送至消息队列中;SQL语法转换,从消息队列中接收并转换SQL语句;SparkSession构建与逻辑执行计划生成,在解析服务中构建并配置SparkSession,设置为Local模式,并启用Hive支持,通过配置元数据存储地址以关联Hive元数据;利用构建的SparkSession,将转换后的SQL语句解析为逻辑执行计划;血缘关系解析,对生成的逻辑执行计划进行遍历解析,通过递归遍历逻辑执行计划中的特定类型节点,识别并提取SQL语句中的表间关系、字段间关系,获取完整的血缘关系数据;血缘数据存储,将解析得到的血缘关系数据保存至图数据库中。
全文数据:
权利要求:
百度查询: 河南中原消费金融股份有限公司 一种基于Spark逻辑执行计划的实时数据血缘分析方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。