买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东省计算中心(国家超级计算济南中心);齐鲁工业大学(山东省科学院)
摘要:本发明涉及一种基于热点预测的Hudi异步压缩的方法和系统,包括:步骤一:将原始数据入湖和更新操作后的数据入湖;步骤二:数据入湖后,获取数据集;步骤三:基于获取的时间戳和数据操作的次数,采用训练好的LSTM模型预测热点时间段和非热点时间段;步骤四:基于训练好的LSTM模型输出的预测热点时间段和非热点时间段,执行数据异步压缩。本发明兼顾提升查询效率和获得较新的数据。解决了MOR表默认同步压缩会造成计算资源浪费的问题,以实现计算资源负载均衡,提高了资源利用率。
主权项:1.一种热点预测的Hudi异步压缩的方法,其特征在于,包括:步骤一:将原始数据入湖和更新操作后的数据入湖;步骤二:数据入湖后,获取数据集,包括:Hudi的Timeline生成相应的Instant,记录了本次操作的具体类型、时间戳和状态,并保存在.deltacommit文件中;获取.deltacommit文件,并通过.deltacommit文件名获取时间戳;步骤三:基于获取的时间戳和数据操作的次数,采用训练好的LSTM模型预测热点时间段和非热点时间段;步骤四:基于训练好的LSTM模型预测输出的多个非热点时间段,多次执行数据异步压缩。
全文数据:
权利要求:
百度查询: 山东省计算中心(国家超级计算济南中心) 齐鲁工业大学(山东省科学院) 一种基于热点预测的Hudi异步压缩的方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。