基于Spark-SQL语句特性的自动资源分配优化方法

导航：龙图腾网> 最新专利技术> 基于Spark-SQL语句特性的自动资源分配优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京科杰科技有限公司

摘要：本发明涉及数据处理技术领域，尤其涉及一种基于Spark‑SQL语句特性的自动资源分配优化方法，包括以下步骤：对历史Spark‑SQL任务的资源数据进行采样，对采样后得到的若干资源数据依次进行预处理和特征提取；使用所述资源分配模型对Spark‑SQL语句进行资源分配，收集资源分配模型的运行特征数据以对资源分配模型进行优化；将所述资源分配模型配置到Hadoop集群中，对Spark‑SQL任务进行资源分配优化；基于实际输出与标准输出的资源分配方案数据量的差异量对资源分配优化的准确性进行判定；在二次判定特征提取的准确性不符合要求时确定特征提取的自学习周期；基于资源数据的平均处理时长对特征提取的自学习周期进行二次调节。本发明实现了对于资源分配优化的准确性的提高。

主权项：1.一种基于Spark-SQL语句特性的自动资源分配优化方法，其特征在于，包括以下步骤：对历史Spark-SQL任务的资源数据进行采样，对采样后得到的若干资源数据依次进行预处理和特征提取，对特征和对应的资源分配方案进行训练以生成资源分配模型；使用所述资源分配模型对Spark-SQL语句进行资源分配，收集资源分配模型的运行特征数据以对资源分配模型进行优化；将所述资源分配模型配置到Hadoop集群中，对Spark-SQL任务进行资源分配优化；基于实际输出与标准输出的资源分配方案数据量的差异量对资源分配优化的准确性进行判定：在判定资源分配优化的准确性不符合要求时，对资源数据分区种类的数量进行调节，或，在初步判定特征提取的准确性不符合要求时根据资源分配模型的平均更新速度对特征提取的准确性进行二次判定；在二次判定特征提取的准确性不符合要求时，调节特征提取的自学习周期，或，基于所述资源分配模型的平均更新速度和资源数据采样的错误次数占比确定资源数据样本字节量的存储容量占比；基于确定的所述自学习周期对资源数据进行提取以获取若干处理周期内资源数据的处理时长；基于资源数据的平均处理时长对特征提取的自学习周期进行二次调节；其中，资源数据包括Spark-SQL任务的类型数量、Spark-SQL任务的数量、处理Spark-SQL任务所需的运行存储容量；特征提取的自学习周期的含义为资源分配模型针对训练数据中没有的资源数据进行特征提取时定期扩充特征提取种类的时间间隔；特征提取种类包括数据集特征、查询历史特征、访问模式特征；对资源数据进行提取的特征包括资源数据中的数据表的大小、JOIN操作数量、子查询深度；资源分配方案的含义为资源分配模型针对Spark-SQL任务输出的最佳资源分配方案；运行特征数据包括对Spark-SQL任务的执行时间、资源利用率、读取的资源数据量；分配资源模型为决策树、随机森林、支持向量机、神经网络；资源数据分区的种类包括数据分片分区、数据块分区、CPU资源分区；标准输出的资源分配方案数据量的含义为资源分配模型针对资源数据进行更新训练的过程中没有出现数据丢失错误从而输出的资源分配方案的数据量。

全文数据：

权利要求：

百度查询：北京科杰科技有限公司基于Spark-SQL语句特性的自动资源分配优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种多自由度解耦的波浪能发电装置及其工作方法

下一篇：一种可移动式预装变电站

相关技术

一种多自由度解耦的波浪能发电装置及其工作方法

一种可移动式预装变电站

一种生物质燃料防结焦气化燃烧炉

通信方法、装置、存储介质及程序产品

一种Z型气动吸附的执行器结构

一种鞘管弹簧丝绕制装置

一种甲酸钙生产用干燥设备

一种惯性传感器探头装置及多自由度检测方法

一种基于三嗪共价有机框架材料的制备及用途

一种葡萄糖传感器及其制备方法

一种新能源汽车语音功能测试方法、系统及设备

钢制防火门的焊接装置

特性相关技术

散射介质的物理特性估计方法及装置_清华大学深圳国际研究生院_202210429477.6

一种避雷器特性测试装置_深圳供电局有限公司_202410839931.4

一种测试植物根系吸水特性的实验装置和方法_上海大学_202310228328.8

一种基于运行特性拟合的光伏功率灵活控制方法_浙大城市学院_202410768725.9

模拟共模扼流圈阻抗特性的电路及共模扼流圈测试系统_深圳市英威腾电气股份有限公司_202323181636.4

一种具备垂直辐射特性的双层共形天线_广东云湃科技有限责任公司_202410719344.1

一种航空发动机部件特性分区修正方法及系统_中国航发湖南动力机械研究所_202410663524.2

一种基于车辆动态特性的智能制动控制系统及方法_一汽奔腾汽车股份有限公司_202410824713.3

一种目标雷达电磁散射特性测量用吸波屏风_国营芜湖机械厂_202410709575.4

面向铣削工况下双转台五轴机床动力学特性实时预测方法_哈尔滨理工大学_202210558844.2

自动相关技术

集自动理袋、自动升降、自动热合于一体的封口装置_漳州青牛科技有限公司_202323530394.5

自动配药器_浙江理工大学_201910792564.6

自动层析柱_江苏汉邦科技股份有限公司_202410927877.9

自动上料机_深圳悦和精密技术有限公司_202420410032.8

自动驾驶车辆_上海易咖智车科技有限公司_202420478325.X

自动接电装置_宜兴赛弗冶金机械有限公司_202323575951.5

自动卸料装置_中交机电工程局有限公司_202410167345.X

自动理疗设备_台州市瀚维数康智能制造有限公司_202323265103.4

自动脱模机_包头市公路建设开发有限责任公司_202421965120.0

自动选配装置_中国第一汽车股份有限公司_202410673972.0

资源分配相关技术

资源分配的方法和装置_华为技术有限公司_201711147521.X

资源分配的方法及用户设备_北京三星通信技术研究有限公司_201810864506.5

利用智能识别的履约资源分配系统_百联全渠道电子商务有限公司_202411095568.6

基站的无线资源分配方法及装置_超讯通信股份有限公司_202210545959.8

一种基于边缘计算节点的算力任务分配资源路径方法_中通服咨询设计研究院有限公司_202410652523.8

基于图神经网络的多无人机雷达资源分配方法_北京理工大学_202410651822.X

一种基于突发感知的时延敏感网络资源分配方法_中国兵器工业计算机应用技术研究所_202410758521.7

应用于飞机蒙皮测量的资源分配方法及装置_湖南大学_202410877002.2

用于改进NR V2X中的资源分配的方法和装置_LG电子株式会社_202280007224.8

基于契约机制的多址边缘计算欺骗感知资源分配方法_安徽大学_202410948244.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于Spark-SQL语句特性的自动资源分配优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务