模式识别方法在入侵检测中的应用.pdf

上传人：qwe****56

文档编号：69628453

上传时间：2023-01-07

格式：PDF

页数：4

大小：500.42KB

( 4.5 )

《模式识别方法在入侵检测中的应用.pdf》由会员分享，可在线阅读，更多相关《模式识别方法在入侵检测中的应用.pdf（4页珍藏版）》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/模式识别方法在入侵检测中的应用姜楠天津大学计算机科学与技术学院,天津摘要将模式识别方法应用到入侵检测领域,用以区分正常和异常的用户或主机行为。采用作为实验数据集,通过计算信息增益,从原始数据中选取对分类结果影响较大的特征属性再分别选取两种带监督的模式识别方法支持向量机和多层神经网络以及两种不带监督的聚类方法一和一进行实验。实验结果表明,上述方法在入侵检刚领域中具有很好的应用前景。关键词

2、模式识别入侵检测支持向量机聚类盯,洲,二叩叩,卿,比,卯一,少叱一呷,而厕人侵监测系统在信息安全领域具有重要的应用价转化为大约百万条记录。每条记录包含个字段,其值。人侵检测系统需要以较高的检测率和较低的误报率中第到第字段为特征属性。特征属性描述网络会区分正常和异常的用户或主机行为。从某种意义上讲,话信息,包括连接时间、端口、源地址、目的地入侵检测问题可以看作是一个分类问题,因此笔者将模址等。第字段为标记字段。每条记录都被标记为正常式识别中的分类和聚类方法应用到人侵检测领域。并且或者是以下四种特定类型的异常行为之一在应用中基于以下三个直观假设正常和异

3、常行为拒绝服务攻击非授权远程访问具有较大差异属于同一种类型的异常行为有较大的非授权使用本地超级用户特权扫描攻相似性某种特定的异常行为在不同的环境中可能击。通过修改参数而产生很大变化。同时选取模式识别中两在实验中,加人了两种新的标记取代原始标记。种带监督的分类方法支持向量机和多层神经网二元标记如果一条记录是异常行为,标记为如络,训练它们识别正常行为和异常行为以及识别果一条记录是正常行为,标记为一。异常行为类型标每种不同的异常行为。由于在实际的应用中,通常没有记根据异常行为类型标记数据集正常一,标识好的训练数据,不能直接使用带监督的方法,因此,。选取

4、两种不带监督的聚类方法一和一特征属性的选取,作为带监督方法的有效补充。由于记录中有些特征属性与分类结果无关,在分类实验数据过程中采用这些特征属性将增加时间复杂度,同时很可本文采用仃实验室在仿真环境下获取的能降低检测率。因此,为获得更高效的分类和聚类,利用数据集,记录个星期内的原始网络数据包,并信息增益的方法,选取对分类结果影响较大的特征属电子技术应用年第期次迎仃灼电子技术应用兀旧年合仃光直 1994-2010 China Academic Journal Electronic Publishing House.All rights reserv

5、ed.http:/性。具体方法如下计算具有个不同值的标记字段的嫡万二一艺,计算标记字段对每个特征属性的条件嫡万一二一艺,、艺,、,、计算对每个耳的信息增益二一较大的值,表示耳对分类的贡献较大。实验中采取保守估计,设定信息增益的阑值为,即选取信息增益大于的特征属性用于实验。最终,针对标记,共选取了个特征属性而针对标记,选取了个特征属性。带监督的方法在所有带监督的模式识别方法中,选取具有广泛应用的支持向量机和多层神经网络方法,训练它们识别正常行为和异常行为以及识别不同类型的异常行为。支持向,机作为较优秀的线性分类器之一,支持向量机的重要特性是分类器只与支

6、持向量的数目相关,这些支持向量有助于分析和了解最有效划分的不同类别的特征属性的值。与此同时,支持向量机还支持核函数,在不增加计算量的前提下将原特征属性空间投影到高维空间,使其可以应对非线性可分的数据集。在实验中,采用函数库构建支持向量机分类器,并分别对加人标记和加入标记的数据集进行实验。实验数据选取原始个特征属性和缩减后的个特征属性或者个特征属性,停止阑值为。因为支持向量机只能区分两个数据类,故将加人功标记的数据集按照异常行为类型分成个子数据集进行测试,每个数据集包含惟一一种异常行为以及所有的正常数据。结果如表所示,其中

7、代表支持向量的数目。表支持向机分类结果针对皿的分类结果分类率个特征属性个特征属性针对功的分类结果高训练效率的同时还有效地提高了分类准确率。针对扫描以及攻击,支持向量机能够达到的分类率,而和攻击也有接近的分类率。此外,通过分析支持向量,能够总结出区分各种异常行为的最有效特征属性。从协议类型特征属性可以发现,扫描攻击倾向于使用协议从几服务类型特征属性可以发现,扫描攻击经常访问服务从几目的字节特征属性可以发现,探测攻击传输较少的字节数从登陆特征属性可以发现,和攻击发生在登陆之后从坛数目特征属性可以发现,被探测攻击的服务器倾向于初始化更多的连接数。多层神经网络一个多层的神经

8、网络由一定数目的节点组成,所有节点被分成输人层、输出层和若干个隐藏层。不同层中的节点通过不同权重的链接关联起来。实验中,将选取的特征属性的值作为输人,通过基于梯度下降的反向传播算法迭代计算权重值,直至达到规定的迭代次数。实验中,使用原始个特征属性的数据进行实验。对加人标记的数据集,统计不同隐藏节点数目的神经网络的分类率。对加入标记的数据集,统计个隐藏节点的神经网络给出的分类结果。具体参数设置如下输人节点数,输出节点数或,迭代次数。分类结果如表所示。当隐藏节点数目为时可以达到较优的分类率,继续增加隐藏节点的数目不会进一步优化分类结果。表多层神经网络分类结果对加人标记的数

9、据集分类结果隐藏节点数分类率使用个隐藏节点对加人助标记的数据集分类结果异常行为类型分类率异常行为类型个特征属性分类率个特征属性分类率可见,通过信息增益方法选取特征属性的操作在提不带监督的方法通过实验可以看出,带监督的方法可以通过训练达到较高的检测率。然而,在实际应用过程中,目前没有可靠的方法来获取正确标识的训练数据。因此在实验中同时选取了不带监督的模式识别方法中的两种聚类算法,一哪和一在现实网络环境中,正常数据的数量通常远远大于异常数据的数量,而且二者之间通常有比较大的距离。因此通过聚类算法将正常数据分成几个大的类,同时将巧次迎网上投稿刃。电子技术应用年第

10、期 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/所有无法划分到这几个大类的数据认定为异常,从而区分出正常行为和异常行为。,数据过滤在训练数据集中,异常数据数目超过了正常数据,为了满足前提假设,需要过滤掉一部分异常数据,使得最终的数据集有超过的正常数据,而异常数据量小于。数据标准化由于没有足够可靠的先验知识来确定特征属性的相对重要程度,所以全部的特征属性都被同等考虑。然而,如果对于不同特征属性使用相同权重,则那些取值较大的特征

11、属性会过分影响聚类的过程,大数量级的特征属性将占统治地位,而小数量级的特征属性在整个分类过程中的作用将被忽略。因此实验中将每个特征属性按如下方法进行标准化计算每个特征属性的均值和标准差图利用一聚类得到的曲线,二仃,二青菩一口,柑一口,击菩“,一。卜。二”式中,厅是每条记录的第个特征属性。将每条记录中连续的特征属性值进行如下转换叼口二以夕厅对于离散的特征属性,如果两条记录对于该离散特征属性具有相同的取值,则它们之间的距离为,否则为。一一算法以标准化后的数据集和常量参数平类半径为输入,计算输出聚类结果。它初始化的类集合为空集。对于每条记录,

12、如果类集合为空,则将此记录作为一个类中心填人类集合中,否则计算它与现存每个类中心的距离,选出最短的距离。如果这个距离小于一个指定的参数常量评,则将此记录归于距离最小的类,否则增加一个新的类并将该记录作为类中心。假设的数据都是正常数据,设置了一个闭值。任何包含大于总记录数据量的类都被认为是正常类实验中选取二。这里应用人侵检测领域常用的曲线描述检测结果。改变参数平的取值,曲线如图所示。结果表明,在误报率小于的前提下,一算法的检测率超过。一一算法根据输人参数,将含有条记录的数据集分配到个类中,使得同一类中的记录具有较高的相似性。其中,每个

13、类由该类中所有记录的平均值类中心进行标识。算法首先随机选取条记录,每条记录代表一个初始类。对其余的记录,则按照它们同个类中心的距离进行聚类,选取最近的作为该记录的分类。然后根据现有的聚类更新各个类的中心,再根据新的类中心进行下一次聚类,直到聚类结果稳定。实验中,对不同参数和初始的类中心进行测试。首先固定参数几,采用不同的随机记录进行初始化,得到的结果最终无较大差异。因此选取前条记录作为初始的类中心。通过改变无的取值,得到如图所示的曲线。从图和图可见,聚类算法在检测率高时误报率也较高,但由于其时间复杂度相对较低,可以将其应用于数据预处理。方法如下通

14、过设置不同的阑值提高检测率,当检测率达到时,误报率在左右见图和图。此时聚类算法检测出来的异常数据集,保留了原始数据集中超过的异常数据,同时过滤掉了大约一半的原始数据集中的正常数据,从而得到了一个可以应用带监督的方法进行进一步检测的小数据集。而且由于异常数据在原始数据集中占的比例很小,通过上述预处理方法得到的数据集的数据量约为没处理之前的一半。图利用一聚类得到的曲线本文利用模式识别中带监督的支持向量机和神经下转第页电子技术应用年第期欢迎灯灼电子技术应用阅。,拓年合仃光盆于 1994-2010 China Academic Journal Electronic Publish

15、ing House.All rights reserved.http:/表各种水印攻击的结果比较色差分量的影响不同,使得嵌人双重水印的算法可以抵抗更多种的水印攻击。例如水印一在压缩上有较强的鲁棒性,但在缩放和色深变换中却检测不到,而水印二正好相反,它在压缩中已经检测不到了,但在缩放和色深变换中效果不错。总之,发挥各自所长,提高了水印算法整体的性能。本文提出了一种基于小波域的数字水印算法。考虑到分量与分量的不同特性和小波低频分量和高频分量的区别,提出了适合于盲提取的基于量化和关系的嵌人策略。量化间隔考虑了反映视觉特性的对比度函数与定律,增

16、强了水印的鲁棒性。关系嵌人也把不同级间的系数关系利用起来,二倍关系的幅值调整减小了图像失真,三次嵌人投票表决也增强了水印的性能。此外,还考虑了舍人误差的补偿。这也使得水印算法成为半盲提取的水印算法。参考文献【杜青基于和量化的彩色图像数字水印算法【苏州大学学报工科版,以拓,【于帅珍,沈建国基于小波域的自适应彩色图像双重水印算法【微计算机信息测控自动化,巧,【向德生,文宏,熊岳山小波域鲁棒自适应图像水印嵌入方案【计算机工程与应用,抖,【李淑明,覃团发,刘贤锋域自适应混沌加密的二值图像数字水印算法通讯和计算机,【王向阳,杨红颖,赵岩,等基于人眼视

17、觉特性的自适应空域彩色图像数字水印算法【辽宁师范大学学报自然科学版,只,【强英,王颖基于小波域的数字图象水印算法综述【计算机工程与应用,以抖,【于景侠,王秉中一种自适应图像小波域数字水印嵌人方案计算机工程与应用,【赵健,齐华,田泽,等改进的小波域混沌数字水印算法实现光子学报,仪抖,【熊志勇,蒋天发多功能彩色图像数字水印方案【武汉大学学报工学版,以抖,【王向阳,杨红颖域自适应彩色图像二维数字水印算法研究【计算机辅助设计与图形学学报,阵,【川郭磊,郭宝龙小波域数字图像水印算法的研究【计算机工程与应用,收稿日期一一上接第页网络方法以及不

18、带监督的一和一。方法分析网络数据记录,进行人侵检测实验证明,利用信息增益的方法,只选取对分类结果影响较大的特征属性进行实验,不会降低检测的准确度同时两种带监督的方法具有很高的检测率,可以直接用于检测人侵行为,而两种不带监督的方法检测率相对较低,且当检测率高时误报率也高。但是,由于这些聚类方法的时间复杂度都相对较低,因此可以将其应用于对原始数据的预处理,在不对检测结果产生过大影响的基础上,过滤掉大量的正常数据,得到一个相对较小但基本上包含了所有原有入侵的数据集,能够大大压缩下一步检测的输人数据量。对于过滤后的数据,采用支持向量机或者多层神经网络分类器进行检测,能够达到更高的检测效率。参考文献一而,一罗叮的切叩肋,即一,耐,【刘比记,收稿日期的一一电子技术应用年第期次迎仃灼电子技术应用以年合订光立于

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 模式识别方法入侵检测中的应用

得力文库 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：模式识别方法在入侵检测中的应用.pdf
链接地址：https://www.deliwenku.com/p-69628453.html