首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于弱监督学习的云服务器配置异常识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中科南京信息高铁研究院

摘要:本发明涉及数据处理领域,具体涉及一种基于弱监督学习的云服务器配置异常识别方法主要包括以下步骤:S1:读取服务器基础配置信息,所述服务器基础配置信息包括离散变量与非离散变量,读取历史服务器使用时长;S2:将服务器基础配置信息作为CatBoost回归模型的特征变量,将历史服务器使用时长作为CatBoost回归模型的监督信息,得到服务器使用时长的预测模型;S3:将服务器基础配置信息中的非离散变量、使用服务器使用时长的预测模型得到的预期服务器使用时长作为孤立森林模型的特征变量,得到异常识别模型。本发明利用了服务器使用时长作为服务器搭配异常问题的弱监督信号,从而提升了模型的表现力。

主权项:1.一种基于弱监督学习的云服务器配置异常识别方法,其特征在于,包括以下步骤:S1:从历史数据中,读取服务器基础配置信息,所述服务器基础配置信息包括离散变量与非离散变量,读取历史服务器使用时长;S2:将服务器基础配置信息作为CatBoost回归模型的特征变量,将历史服务器使用时长作为CatBoost回归模型的监督信息,得到服务器使用时长的预测模型,用于计算预期服务器使用时长;S3:将服务器基础配置信息中的非离散变量、使用服务器使用时长的预测模型得到的预期服务器使用时长作为孤立森林模型的特征变量,得到异常识别模型;S4:将待测试的数据中,服务器基础配置信息输入服务器使用时长的预测模型,并将得到的预期服务器使用时长作为异常识别模型的输入,同时将服务器基础配置信息中的非离散变量作为异常识别模型的输入,即可得到被识别为异常的服务器;其中,S3中服务器基础配置信息中的非离散变量,非离散变量间相关度低于相关度阈值的变量独立作为孤立森林模型的特征变量,非离散变量间相关度高于相关度阈值的变量取互相之间的比例,作为孤立森林模型的特征变量;其中,所述孤立森林模型生成的异常识别模型,在其异常识别步骤增加一个条件,需同时满足预期服务器使用时长低于服务器使用时长阈值时,才能判定为异常;其中,所述服务器基础配置信息的离散变量为系统、架构,所述服务器基础配置信息的非离散变量为CPU核数、内存容量、硬盘容量、网络带宽;其中,所述S2中CatBoost回归模型使用的超参数包括:迭代次数:1000,决策树结构:对称,L2正则化强度:3,决策树最大深度:6,学习率:0.0496,最大叶子数量:64;其中,所述S3中孤立森林模型的超参数包括:是否使用Bootstrap:是的,污染度:0.01,最大特征数:1.0,决策树数量:1000;其中,异常识别模型的预测结果是由异常分数来决定的,即模型超参数中的污染度sx,n,具体公式为: -hx表示样本x在树上的深度,E[hx]表示其在所有树上的平均深度;-cn表示使用n个样本构建二叉树时的平均路径长度,用来对E[hx]做标准化处理;sx,n的数值范围为0到1,其中越接近于1是异常点的可能性越大。

全文数据:

权利要求:

百度查询: 中科南京信息高铁研究院 一种基于弱监督学习的云服务器配置异常识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。