买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华侨大学
摘要:本发明公开了一种网络入侵检测中数据不平衡处理方法,方法包括:利用随机稀疏投影增强原始特征的训练多样性;然后将特征空间聚类为预定义数量的子空间,并使用信息论和簇大小相结合的基于聚类的无限特征选择算法CInf‑FS评估每个子空间内的特征;在剔除冗余特征后,通过重采样生成候选子集,并迭代计算子集间多样性与子集与特征空间的相似度,从而选择最优子集。本发明利用选择的最优子集构建平衡数据集训练分类器,并在数据集上验证算法性能,通过评估指标进行评估,提供了一种对数据不平衡影响小,性能更佳,鲁棒性更高的解决方案。
主权项:1.一种网络入侵检测中数据不平衡处理方法,其特征在于,包括:S101,构建随机稀疏矩阵对基于网络数据生成的原始数据矩阵进行投影,获得新数据矩阵其中,N表示数据矩阵中的样本数,d表示每个样本的特征数,d′表示新数据矩阵输出特征的维度;S102,将新数据矩阵的原始特征集F和标签集Y划分成K个簇μ1,μ2,…,μK,并将特征集F中的每个特征分配给最近的聚类中心的簇中;S103,根据分配给各个簇的特征重新计算聚类中心;S104,重复S102~S103,直至聚类中心不再改变;S105,计算每个簇Ci中的特征之间的斯皮尔曼等级相关系数;S106,基于斯皮尔曼等级相关系数估算X′中保留的特征数r;S107,结合特征和标签集Y之间的互信息和簇大小计算各个特征的最终得分;S108,保留最终得分靠前的r个特征,生成多数类的数据矩阵S109,从多数类的数据矩阵中随机选择N1个样本创建子集在每次迭代中均生成q个候选子集其中,N1表示少数类样本的个数;S110,对于第α次迭代的候选子集,构建一个用邻接矩阵表示的无向全连接图其中,表示各个候选子集的顶点集,ε={eij|i,j=1,2,…,q}表示候选子集之间的权重;中的每个条目aij表示和之间成对的能量;S111,基于每个alp的多样性得分、子集的新颖性得分和子集之间的相似性得分计算出每个aij的表示;S112,根据邻接矩阵计算候选子集的分数;S113,基于候选子集的分数,选择个排名靠前的子集用于训练分类器;S114,重复S109~S113,直至达到预设迭代次数。
全文数据:
权利要求:
百度查询: 华侨大学 一种网络入侵检测中数据不平衡处理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。