首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种云计算场景下的基于MCE panic虚机高可用方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天翼云科技有限公司

摘要:本申请提供了一种云计算场景下的基于MCEpanic虚机高可用方法和装置,在宿主机上发生不可检测和不可恢复的错误时不立刻panic处理,先发送带有可识别属性的SIGBUG信号给ctyun_agent进程,ctyun_agent通知云中台迁移该宿主机的所有虚机到健康状态的机器上,达到虚机高可用性,满足企业客户对云服务五九标准的需求。

主权项:1.一种云计算场景下的基于MCEpanic虚机高可用方法,其特征在于,该方法包括:步骤1、对内核函数和容器管理进程进行改造;步骤2、对宿主机上发生的错误进行检测,当发生不可检测和不可恢复错误时,所述改造后的内核函数发送带有可识别属性的第一指示信号至容器管理进程;步骤3、所述容器管理进程对所述第一指示信号进行识别,并根据识别结果向云中台发送第二指示信号;步骤4、云中台根据所述第二指示信号启动虚机迁移指令,对发生不可检测和不可恢复错误的宿主机上的虚机进行迁移;在步骤1中,对内核函数进行改造,包括:对内核函数mce_panic进行改造,以使内核函数mce_panic在当发生不可检测和不可恢复错误时不进行内核panic,而是发送带有可识别属性的第一指示信号至容器管理进程;其中,所述第一指示信号为SIGBUS信号,所述容器管理进程为ctyun_agent进程;在容器管理进程ctyun_agent中增加对SIGBUS信号进行捕获;所述对内核函数mce_panic进行改造,包括:步骤101、梳理对mce异常的处理过程,判断是否存在mce错误是系统态无法处理严重的问题错误,如果是则标记该mce为no_way_out,扫描全部bank后调用mce_panic造成系统内核panic;步骤102、对mce_panic函数进行重新编码以实现向第一指示信号至容器管理进程;步骤103、将改造后的内核函数mce_panic的补丁制作成kpatch;步骤104、安装kpatch热升级mce_panic函数的新功能;在步骤101中,mce_panic在do_machine_check函数中通过mce_rdmsrl读取cpu上每个bank上MSR_IA32_MCG_STATUS状态寄存器的内容;在步骤102中,通过容器管理进程ctyun_agent的pid找到对应的task,给所述对应的task发送带有SEND_SIG_FOR_AGENT标识的信号给ctyun_agent进程。

全文数据:

权利要求:

百度查询: 天翼云科技有限公司 一种云计算场景下的基于MCE panic虚机高可用方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。