摘要:随着经济与科技的不断发展,无线网络已经成为了整个社会人们非常重视的对象之一。针对无线网络的异常问题展开研究,可以对其存在的威胁予以识别。传统方案十分繁琐,且效率不高,同时精确度也达不到规定的要求。为此,必须对检测仿真展开研究,促使其优势能够充分表现出来,从而能够找到数据流量中的异常点。本篇文章将阐述异常情况出现的主要原理,探讨异常优化的检测方法,并对于实验和仿真方面提出一些合理的见解。
关键词:无线网络;数据流量;异常检测
引言:从现阶段发展而言,数据流量异常的问题变得越来越普遍,其主要是指入侵人员预先编制了相关程序,从而对大量主机造成了感染。伴随计算机技术的长足发展,流量异常问题的研究工作便成为了许多研究人员的主要课题。现如今流量异常研究的方法逐渐增多,具体结果的质量也有了很大的提高。
一、异常情况出现的基本原理
在对于数据流量异常情况进行检测的时候,可以先从中提取流量异常的基本特征,从而给出数据的时间序列,将网络中出现的异常流重新分组,获得的异常流及其关联最大的阈值。将此作为参考展开流量异常检测的工作,具体方法如下。
假设ODdfg表示实际流量的数量,nfj表示采样点数,则利用公式提取流量的具体异样特征。之后再假设dshj表示流量本身的量值,同时Sdjnl表示各个数据包之间的距离,则以此为基础可以得到时间序列。最后再假设dsgj表示被测网络内部各个主机之间的关系分数,同时kfij则表示关联公式具体系数的数量,再利用相关公式完成对于异常状况的检测工作。由此能够看出,无线网络内部异常流量优化工作的基本原理,通过该原理能够完成相应的检测工作。
二、异常优化情况的检测方法
(一)行为模式的提取
流量数据的特性具有多种特征,一些受到病毒感染的主机依靠相关命令能够混杂于网络之中,持续的时间非常短,同时容量很低。所以,为了能够提升检测工作的精确性,需要根据信息技术网络流量本身的异常点,将其中的序列信息全部提取出来,从而将该信息熵值重新定义成十分存在异常状况的基本标志,异常为基础得出具体信息之中,为主机提供行为流,并对两个主机本身行为流的具体距离予以测量。通常而言,具体步骤如下[1]。
假设X为随机量,而P(xi)则表示xi的具体取值概率,在有限的区间之内,X无法保证可以活动所有的数值。而如果将X的取值范围进行调整,改成(x1,x2……,xm),则M主要表示X取值为不同的数量,并利用相关公式完成流量异常点的计算。而如果假设pdji代表IP属性,而jfij则表示端口的数形,再利用相关公式可以得到流量特征的信息熵。该信息熵能够对于网络通信的质量予以反映,如果有异常情况出现,则稳定性便会发生改变。之后再由Δt表示时间的区间,再用h表示主机,再一来能计算出度的信息熵公司,从而获得熵值的平均值。最后再利用kfij表示处于中心位置主机的基本行为,在利用khlp表示所有行为的聚合,则根据相关公式可以得到两个主机之间本身行为流距离的度量[2]。
由以上内容可以知道,在对于数据流量异常情况予以实现的时候,需要先按照信息熵对于网络中出现的异常点进行测量,从中提取一些存在异常情况的信息熵,从而将其中产生剧烈便会的信息熵重新定义成流量中是否会有异常情况发生的标志,以此为基础获得出度的信息熵,得出主机自身的行为流,进而为后期数据流量的入侵检测提供有力的基础。
(二)数据异常情况的检测
在对于网络中出现的数据异常情况进行优化检测的时候,以3.1节为单位,获得两个主机自身行为流的度量函数,并将其设计为Qdgj。之后再将无线网络中数据异常问题转变成对于网络状况分析的问题,再依靠相关公式进行描述。
期刊文章分类查询,尽在期刊图书馆其中,假设K表示引入进来的核函数,而f(x)则表示决策函数,再依靠公式将核函数引入其中,以此泛化网络流量中存在的异常样本。最后再假设ndhk表示n维空间中某一个特殊样本,而lfhj表示样本采集工作的不平衡程度,再依靠公式将其近邻位置的抽样设计进行分类,从而完成网络数据流量中的异常检测工作。
三、实验和仿真证明
为了能够测试和验证所提方法进行无线网络中数据异常状况的的实验。在本次实验案例过程中,一共应用了5台计算,太网交换机的数量超过2台,并将4种网络病毒随机放置于6台虚拟机内部,并安排其中一部分计算机没有任何病毒存在,而部分虚拟机则有病毒存在。在48个小时之内对于病毒在当前网络中的活动状况予以检测,同时利用软件Wireshark进行病毒数据的搜集。在实验过程中,依靠Wireshark软件对于计算机中迅雷、QQ旋风、百度网盘、爱奇艺以及暴风影音播放器软件进行搜索,寻找其内部的网络数据包。之后再利用PerlSeript软件从Wireshark中找出原始数据的位置,并将数据流从中全部提取出来。将一些正常的P2P软件获得的数据流量重新定义成正类样本,再将网络病毒造成的流量定义成负类样本。整个实验数据全部都有正类以及负类样本组成。全部实验则依靠Matlab7.0软件对于优化检测平台进行创设,在实验的过程中,必须依靠多次交叉验证的方法进行处理,每一次实验至少需要循环19到20次,并从中获取平均数值[3]。
(一)评价指标的设置
由于数据的资料过大,因此从训练集以及测试集内部各自抽取了16000条数据作为样本,其分别是训练样本以及测试样板。在整个实验的过程中,为了保证异常检测工作的可行性,从而将实验一共分成了两个阶段。进入第一阶段时,主要以检测效率以及误报率为基础进行流量异常检测,并对于相关性能予以评价。进入第二阶段后,为了保证实验本身具有较强的全面性以及公正性,主要采取相关文献内容的要求作为对比方案开展分析以及对比工作,依靠异常分类的方法对于整个数据流量异常问题检测工作的优势予以明确[4]。
(二)误报率的具体测试
依靠欠抽样的方法进流量异常检测的工作,以此对网络中异常情况展开检测,主要包括检测效率以及误报率。而且随着数据种类的增加,依靠相关方案可以完成全部检测工作,同时检测效率也不会受到影响,并且能够将误报率控制在有限的范围之内。
(三)正确率的对比
分别采取近邻抽样的方法以及文献资料提取方案进行异常优化的检测工作,并将两种方案中数据流量的异常状况予以对比,从而能够获得虚警率以及流量本身分类的正确率。通过仿真结果可以知道,当数据在不断增加的时候,相比于传统的文献方案,采取所提方法进行流量检测时可以对于具体异常状况予以判断,从而能够将异常检测工作的虚警率进行控制,提升整个检测工作的精确性以及可靠性。
四、结束语
综上所述,采取相关方法进行异常检测的时候,很难对于网络中出现的异常流量予以区分,从而出现了精确度不够的问题。因此可以采用欠抽样方法的异常检测方案,整体效果极佳,获得的数据结果具有非常高的精确性,能够有效完成异常检测工作。
参考文献:
[1]李兴国,王俊峰.无线网络数据流量异常优化检测仿真研究[J].计算机仿真,2017,34(9):386-389.
[2]李树军.无线网络通信节点传输快速性优化研究仿真[J].计算机仿真,2017,34(1):272-275.
[3]郑黎明,邹鹏,贾焰.多维多层次网络流量异常检测研究[J].计算机研究与发展,2015,48(8):1506-1516.
[4]刘董,郑宁,徐海涛,等.网络异常检测中一种隶属度函数优化的新方法[J].微电子学与计算机,2017,25(6):186-189.
论文作者:张春余
论文发表刊物:《基层建设》2018年第14期
论文发表时间:2018/7/16
标签:异常论文; 流量论文; 数据论文; 工作论文; 无线网络论文; 网络论文; 公式论文; 《基层建设》2018年第14期论文;