基于支持向量机简化算法的网络入侵检测系统.pdf

上传人:e2 文档编号:1090109 上传时间:2018-03-30 格式:PDF 页数:9 大小:400.82KB
返回 下载 相关 举报
摘要
申请专利号:

CN200910099346.0

申请日:

2009.06.02

公开号:

CN101594361A

公开日:

2009.12.02

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):H04L 29/06申请公布日:20091202|||实质审查的生效|||公开

IPC分类号:

H04L29/06; G06N1/00

主分类号:

H04L29/06

申请人:

浙江大学

发明人:

吴 群; 曾志强; 吴剑锋; 柴春雷

地址:

310027浙江省杭州市西湖区浙大路38号

优先权:

专利代理机构:

杭州裕阳专利事务所(普通合伙)

代理人:

江助菊

PDF下载: PDF下载
内容摘要

本发明一种基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)=sgn(∑Nsi=1αiyik(xi,x)+b),其中(xi,yi),i=1,...,Ns就是所谓的支持向量,它们对应的拉格朗日乘子αi大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。该系统通过约简支持向量提高了SVM分类器的分类速度,从而使得基于此精简支持向量机的网络入侵检测系统的实时响应能力得到极大提高,同时保证系统比较低的误检率和漏检率。

权利要求书

1、  一种基于支持向量机简化算法的网络入侵检测系统,其特征在于:该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)=sgn(Σi=1NSαiyik(xi,x)+b)---(1),]]>其中(xi,yi),i=1,...,Ns就是所谓的支持向量,它们对应的拉格朗日乘子αi大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。

2、
  如权利要求1所述的基于支持向量机简化算法的网络入侵检测系统,其特征在于:SVM分类器最优分类超平面所对应的向量w在形式上表示为所有支持向量在特征空间中的线性组合:

3、
  如权利要求2所述的基于支持向量机简化算法的网络入侵检测系统,其特征在于:SVM分类器采用一个约简的向量集wo(3)来代替原有的支持向量集w(2):其中{z1,...,zNZ}∈Rd]]>就是约简向量集,βi∈R为约简向量zi所对应的权值,NZ为约简向量集所包含的向量个数,并且NZ<NS

4、
  如权利要求3所述的基于支持向量机简化算法的网络入侵检测系统,其特征在于:SVM分类器削减支持向量数目时,首先构造一个新的约简向量及其对应权值(z1,β1)来近似(2)式中的向量w,接着迭代地构建(zm+1,βm+1)来近似向量wm,wm的形式如下:

5、
  如权利要求4所述的基于支持向量机简化算法的网络入侵检测系统,其特征在于:SVM分类器对高斯核函数采用不动点迭代法来寻找约简向量z,求约简向量z的迭代公式为:zn+1=Σi=1NSαiexp(-||xi-zn||2/(2σ2))xiΣi=1NSαiexp(-||xi-zn||2/(2σ2)).]]>

说明书

基于支持向量机简化算法的网络入侵检测系统
技术领域
本发明涉及一种网络入侵检测系统,尤其涉及一种基于支持向量机简化算法的网络入侵检测系统。
背景技术
入侵检测顾名思义,便是对入侵行为的发觉,它是为保证计算机系统的安全而设计与配置的一种能够及时发现并报告系统中未授权或异常现象的技术。网络入侵检测所处理的数据是由多类攻击数据和正常数据构成的,因此网络入侵检测可以看作一个多分类问题。入侵检测系统的关键在于正常和异常行为模式库的建立。建立行为系统的方法主要有神经网络、数据挖掘等。这些方法有一个共同特点,就是所需要的训练数据量大,然而在入侵检测领域中能够获得的数据常常呈现出多变性、高维性和小样本,不能满足传统的统计方法的前提条件,以致误检率和漏检率都比较高。
支持向量机(Support Vector Machine,SVM)和核学习方法主要用于解决有限样本学习问题,而且对数据的维度和多变性不敏感,具有较好的分类精度和泛化能力,因此,它们被广泛应用于入侵检测系统,并取得了良好的检测效果。
然而,SVM分类器的分类速度取决于支持向量的数目,如果支持向量数目很大,分类器的分类速度会很慢。对于入侵检测这种实时性要求极高的系统,缓慢的检测速度将极大地影响其性能,使其不能及时地检测攻击并作出响应。
因此,需要一种分类速度快同时误检率和漏检率都比较低的网络入侵检测系统,以保证网络的正常使用。
发明内容
为克服现有技术的上述缺陷,本发明基于支持向量机简化算法的网络入侵检测系统提出一种基于SVM简化算法网络入侵检测系统,通过约简支持向量提高了SVM分类器的分类速度,同时基于此精简支持向量机的网络入侵检测系统的实时响应能力得到极大提高。
为实现上述技术目的,本发明采用的技术方案如下:
一种基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)=sgn(Σi=1NSαiyik(xi,x)+b)---(1),]]>其中(xi,yi),i=1,...,Ns就是所谓的支持向量,它们对应的拉格朗日乘子αi大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。
本发明基于支持向量机简化算法的网络入侵检测系统与现有技术相比,具有如下有益效果:该系统通过约简支持向量提高了SVM分类器的分类速度,基于此精简支持向量机的网络入侵检测系统的实时响应能力得到了极大提高。
附图说明
图1是本发明基于支持向量机简化算法的网络入侵检测系统的框图。
具体实施方式
以下结合附图对本发明基于支持向量机简化算法的网络入侵检测系统作进一步描述。
本发明基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)=sgn(Σi=1NSαiyik(xi,x)+b)---(1),]]>其中(xi,yi),i=1,...,Ns就是所谓的支持向量,它们对应的拉格朗日乘子αi大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。
为描述方便起见,本发明中将类别信息集成进Lagrange乘子αi中,下文的所有αi都采用了类似处理,相应地,(1)式这个判定函数变更为:
f(x)=sgn(Σi=1NSαik(xi,x)+b)---(2)]]>
此时的αi为不等于零的数。从(2)式可以看出,判定一个未知类别的样本所需要的时间和支持向量的数目成正比,因此,削减支持向量的数量能够有效地提高分类机的分类速度。
SVM分类器训练所得的最优分类超平面所对应的向量w在形式上表示为所有支持向量在特征空间中的线性组合:
本发明中SVM简化法试图采用一个约简的向量集来代替原有的支持向量集:

其中{z1,...,zNZ}∈Rd]]>就是约简向量集,βi∈R为约简向量zi所对应的权值,NZ为约简向量集所包含的向量个数,并且NZ<NS。这样,可以用w%代替w来判定未知类别的向量x,此时,SVM的判定函数形式如下:
f(x)=sgn(Σi=1NZβik(zi,x)+b)---(5)]]>
SVM简化法的目标就是在尽量减小分类精度损失的前提下,寻找最小的NZ=NS和对应的约简向量集,形成一个精简的SVM分类器来提高分类速度。
在削减支持向量数目时,首先构造一个新的约简向量及其对应权值(z1,β1)来近似(3)式中的向量w,接着迭代地构建(zm+1,βm+1)来近似向量wm,wm的形式如下:

由于不可能精确地找到向量zm和对应权值βm使向量wm为零。所以只能通过非线性优化来寻找最小的δ,δ的形式如下式所示:

对于某些特殊的核函数如高斯核函数,SVM分类器采用不动点迭代法来寻找约简向量z,设(7)式导数为零,求约简向量z的迭代公式如下式所示:
zn+1=Σi=1NSαiexp(-||xi-zn||2/(2σ2))xiΣi=1NSαiexp(-||xi-zn||2/(2σ2))---(8)]]>
假设简化前后SVM分类器的支持向量分别为NS,NZ,以核函数的计算次数来度量,则原始SVM分类器预测一样本的时间复杂度为O(NS),精简SVM分类器对应的时间复杂度为O(NZ),由于NZ=NS,所以精简SVM分类器比原始SVM分类器具有更低的分类复杂度。
本发明采用的KDD CUP 1999作为实验数据集。该数据集是Wenke Lee等人在1998年美国国防部高级研究计划局(DARPA)作IDS评测时所获得数据基础上恢复出来的连接信息。这批数据总共包含7个星期的网络流量,大约有500万条连接记录。由于原始数据集过于庞大,所以只有两个具有代表性的数据集被选取作为实验数据集,一个名为10Percent(训练集),包含494,020条记录,另一个名为Correct(测试集),包含311,029条记录。
入侵检测训练集包含正常网络流量数据和22个攻击类别,测试集除正常流量数据外还包含38个攻击类型。本实验将这两个数据集按照大的类型划分成5类,形成新的训练集和测试集。入侵检测训练和测试集的具体描述如表1所示。表1入侵检测数据集的训练及测试数据描述

  类型名称  类标记  训练记录数  测试记录数  Normal  1  97,277  60,593  Probe  2  4,107  4,166  DOS  3  391,458  229,851  U2R  4  52  230  R2L  5  1,126  16,189

入侵检测数据集包含了7个符号属性,而支持向量机只能处理数值属性,因此必须将符号属性转换为数值属性。转换方法如下:首先创建一个全为0的数值序列An...A2A1,序列的长度等于该属性的取值种类并且序列中每个数和该字符属性的每一取值一一对应,如果某条记录该属性取某个值,则数值序列中对应的数的值置为1,其余仍为0,此时该序列可看作一二进制值,对应十进制值即为所求数值。处理完符号属性后将所有的属性值都规格化到[0,1]区间。
对数据进行适当预处理后,选择LIBSVM作为标准的SVM训练算法。核函数采用高斯核函数,惩罚算子C及核函数参数都是采用LIBSVM在实验数据集一随机抽取的子集上10次交叉测试所得结果的最优值。
实验结果如表2所示,其中第1行为不同的约简率,2-4行对应5类问题的精简SVM分类器的支持向量数、在测试集上的错误率和测试时间。其中第二列三行分别对应原始SVM分类器的支持向量数、测试错误率及在测试集上的运行时间。
表2:不同约简率下分类器性能比较
  Simplified Rate(%)  0  60  80  95  #RSVs  1,0791  4,316  2,158  540  Errors rate(%)  3.22  3.41  5.2  7.2  Testtime(s)  1,174  621  455  121

从表2可以看出,随着约简率增大,相应的精简SVM分类器在测试集上的分类速度也随着提高。虽然精简SVM分类器的泛化性能随着约简率增大而有所降低,但与检测速度提升幅度相比,泛化性能的损失微乎其微。当对支持向量取得高达95%削减率的同时,却仅有7.2%的分类精度损失,与此同时,精简SVM分类器在测试集上的分类速度却是原SVM分类器的近10倍。这说明对入侵检测数据集,支持向量简化方法在极大削减支持向量的同时,基本保持了原SVM分类器的分类精度,极大地提高了SVM分类器的分类效率,解决了SVM应用于入侵检测系统所存在的速度瓶颈。
本发明基于支持向量机简化算法的网络入侵检测系统是一种基于SVM简化算法网络入侵检测系统,通过约简支持向量提高了SVM分类器的分类速度,从而使得基于此精简支持向量机的网络入侵检测系统的实时响应能力得到极大提高,同时保证系统比较低的误检率和漏检率。

基于支持向量机简化算法的网络入侵检测系统.pdf_第1页
第1页 / 共9页
基于支持向量机简化算法的网络入侵检测系统.pdf_第2页
第2页 / 共9页
基于支持向量机简化算法的网络入侵检测系统.pdf_第3页
第3页 / 共9页
点击查看更多>>
资源描述

《基于支持向量机简化算法的网络入侵检测系统.pdf》由会员分享,可在线阅读,更多相关《基于支持向量机简化算法的网络入侵检测系统.pdf(9页珍藏版)》请在专利查询网上搜索。

本发明一种基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)sgn(Nsi=1iyik(xi,x)+b),其中(xi,yi),i1,.,Ns就是所谓的支持向量,它们对应的拉格朗日乘子i大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 电学 > 电通信技术


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1