首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

分布式系统故障判断与恢复方法、应用该方法的云操作系统以及计算平台 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广东琴智科技研究院有限公司

摘要:本发明公开了分布式系统故障判断与恢复方法、应用该方法的云操作系统以及计算平台,涉及故障判断的技术领域,使用Corosync获取集群内若干组节点的状态数据信息,并结合分布式一致性算法,准确判断出故障节点并做出相应标记,此方法确保了系统能够实时监控节点状态,快速识别故障节点,避免因单个节点故障导致系统整体性能下降。通过检测分布式操作系统内相关资源运行数据信息及磁盘状态数据信息,构建健康影响集合,通过这些全面的数据收集和分析,可以更加精确地评估每个故障节点的健康状态,提供更准确的恢复难易程度预测。利用深度学习技术结合训练后的健康预测模型,对健康影响集合进行特征提取和分析计算。

主权项:1.分布式系统故障判断与恢复方法,其特征在于:包括以下步骤,S1、利用ApacheMesos作为资源管理器,构建虚拟资源池,并使用Mesos作为分布式操作系统的内核,处理资源分配及集中管理集群;S2、在分布式操作系统中,依据Corosync,获取集群内若干组节点的相关状态数据信息,并构建节点数据集合,依据节点数据集合,并结合分布式一致性算法,判断出若干组故障节点,并做出相应标记;S3、根据S2步骤中获取的若干组故障节点,检测分布式操作系统内相关资源运行数据信息及磁盘状态数据信息,以构建健康影响集合;依据Corosync,实时传递集群信息与心跳信息,以获取集群内若干组节点的相关状态数据信息,并构建节点数据集合,其中,节点数据集合包括集群内节点数量Jdsz、各个节点发送心跳信号的时间戳及各个节点接收心跳信号的时间戳;S4、通过将所述健康影响集合进行特征提取,以分别获取相应故障节点的磁盘使用率Csyz、CPU使用率Csz、坏块数量Hksz及IO错误次数Cwp,通过利用深度学习技术,并结合训练后的健康预测模型,分析计算获取资源使用系数Zsxs及磁盘状态系数Czxs,并通过将所述资源使用系数Zsxs及所述磁盘状态系数Czxs相关联,拟合获取相应故障节点的健康指数Jkzs;S5、预先设置预测阈值Q,并将所述预测阈值Q与相应故障节点的健康指数Jkzs进行对比分析,综合预测出当前故障节点恢复难易报表,并以可视化形式展现于计算平台;设定固定的时间间隔TzTz,集群中每个发送节点以固定的时间间隔TzTz向接收节点发送心跳信号,以表明自己是活跃的,集群中接收节点接收到发送节点的心跳信号后,记录收到心跳的时间戳;根据收到的心跳时间戳,接收节点初步判断发送节点是否存在故障风险,具体初步判断内容如下:若第n次发送时间戳-第n-1次发送时间戳>固定的时间间隔TzTz时,接收节点将初步判断发送节点存在故障风险,并将发送节点标记为判断节点;若第n次发送时间戳-第n-1次发送时间戳≤固定的时间间隔TzTz时,接收节点将初步判断发送节点未存在故障风险。

全文数据:

权利要求:

百度查询: 广东琴智科技研究院有限公司 分布式系统故障判断与恢复方法、应用该方法的云操作系统以及计算平台

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。