首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多层分类策略的随机森林入侵检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:兰州交通大学

摘要:本发明公开了一种基于多层分类策略的随机森林入侵检测方法,首先对入侵检测数据进行预处理,然后计算预处理后的测试集中每个样本类别间的相似度,根据相似度将特征相似的类聚集为超类,通过随机森林的算法进行分类;该层分类完成后,再将超类继续送入下一层中重新划分超类,直到所有类别分类完毕。本发明以随机森林作为基本单元构建多层模型,通过在不同层划分出不同的超类,每一层使用不同的特征选择算法,使每一层的样本划分都能够匹配最适合的特征子集。与随机森林入侵检测相比,本发明的入侵检测方法能够解决样本类别分布不均匀的问题,提升对小样本类别分类的准确率。

主权项:1.一种基于多层分类策略的随机森林入侵检测模型的生成方法,其特征在于,包括以下步骤:1对入侵检测数据进行预处理,包括畸形样本处理、分类数据和时序数据编码、数据尺度缩放以及特征选择和提取;2构建多层分类模型①计算预处理后的测试集中每个样本类别间的相似度,根据相似度将特征相似的类聚集为超类;②将所述超类作为一个分层,通过随机森林的算法进行分类,对超类分类的模型决策节点进行特征子集的选择;所述随机森林的算法如下:a.设训练集为T,包含N个样本,即T={t1,t2,...tN},设特征集为F,有M维特征,即F={f1,f2,...fM},类别集合为C,有L种类别,即C={c1,c2,...cL},测试集为D,有λ个测试样本,即D={d1,d2,...cλ};b.从容量为N的训练集T中,采用自助抽样法,即有放回地抽取N个样本,作为一个训练子集Tk;c.对于训练子集Tk,从特征集F中无放回地随机抽取m个特征,其中m=log2M,作为决策树上的每个节点分裂的依据,从根结点开始,自上而下生成一个完整的决策树Sk,不需要剪枝;d.重复n次步骤a和b,得到n个训练子集T1,T2,...Tn,并生成决策树S1,S2,...Sn,将n个决策树组合起来,形成随机森林;e.将测试集D的样本dμ输入随机森林中,让每个决策树对dμ进行决策,然后采用多数投票法对决策结果投票,最终决定dμ的分类;f.重复λ次步骤e,直到测试集D分类完成;③根据选择的特征子集对该层超类进行类别分割;④对分割后的单个超类送入下一层中,并根据单个超类中每个样本类别间的相似度重新划分超类,重复步骤②和③,逐渐迭代至超类只包含每一个小类,完成测试集分类。

全文数据:

权利要求:

百度查询: 兰州交通大学 一种基于多层分类策略的随机森林入侵检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。