高保泰
(宁夏电力公司固原供电公司 756000)
摘要:本文分析了智能变电站站控层网络和过程层网络的通信方式和网络风暴产生的原因;其次依据目前智能变电站的典型架构建立了网络风暴模拟测试环境并设计了测试用例,并且提出了通过对网络风暴报文进行硬件过滤和风暴识别进而避免网络风暴冲击的方法,经验证该方法改进效果良好,提高了智能变电站组网设备抵御网络风暴的能力。
关键词:智能变电站;防御;网络风暴;能力
智能化变电站是由智能化一次设备(电子式互感器、智能化开关等)和网络化二次设备分层(过程层、间隔层、站控层)构建,建立在IEC61850标准和通信规范基础上,能够实现变电站内智能电气设备间信息共享和互操作的现代化变电站。网络在给智能变电站带来数据的充分共享等优点的同时,也对智能变电站的安全可靠运行带来一定的影响,其中影响最为恶劣的就是网络风暴。网络风暴除了会造成网络堵塞、系统大面积断网等影响外,还会冲击过程层、间隔层中所有组网设备,造成其网卡接收缓冲区溢出,大量占用CPU资源,导致各组网设备软件程序死机或重启,危害智能变电站的安全稳定运行。
一、过程层和站控层网络通信方式
1.1过程层网络
智能变电站过程层网络主要传递SV(采样值)和GOOSE(面向通用对象的变电站事件)报文,实现测控数据和保护装置间失灵启动等信息的传输。网络报文采用组播通信方式,工程应用中常采用VLAN(虚拟局域网)或GMRP(组播注册协议)等网络隔离措施对报文进行有效隔离。
1.2站控层网络
智能变电站站控层网络主要的通信报文有MMS(制造报文规范)、GOOSE、ARP(地址解析协议)等。通信方式覆盖了单播、组播、广播三种通信方式。①MMS(制造报文规范)报文。IEC61850标准针对变电站所有功能定义了比较详尽的逻辑节点和数据对象,并提供了完整的描述数据对象模型的方法和面向对象的服务。这些抽象的通信服务、通信对象及参数通过特殊通信服务映射(SCSM)映射到底层应用程序,按照MMS报文采用单播通信方式传输,实现间隔层装置与监控系统的通信。②ARP报文。智能变电站用交换机多为二层交换机,二层交换机属数据链路层设备,主要靠识别数据包中的MAC地址信息,根据MAC地址进行数据包转发。③GOOSE报文。智能变电站站控层网络的GOOSE报文功能区别于过程层网络的GOOSE报文,其主要用于实现间隔层装置间的联闭锁功能和低压侧间隔层装置的跳闸功能,采用组播通信方式。
二、网络风暴产生的原因与处理措施
2.1网络风暴产生的主要因素
①交换机异常。交换机作为网络核心交换设备,如果自身的报文转发机制异常,如VLAN机制失效,会导致网络风暴。②组网设备网卡异常。组网设备网卡发生异常,可能会导致报文大量发送,导致网络风暴。③网络环路。这是智能变电站网络风暴产生的一个重要原因。一旦产生网络环路,对于站控层网络,广播报文会形成网络风暴。
2.2避免网络风暴的措施
①可以提高交换机等组网设备质量,降低网络设备故障引起的网络风暴概率。针对网络环路问题,除了加强管理,保证工程实施时避免环路接线外,可以使能交换机的生成树协议。
期刊文章分类查询,尽在期刊图书馆主流交换机设备均支持生成树协议,生成树协议使能后,交换机会在环路处形成虚断,避免网络风暴的产生。②采取有效措施提高各组网设备抵御网络风暴的能力,保证在网络风暴过程中组网设备运行正常,保留核心功能。
三、测试探究
3.1测试方法
测试时通过两种手段来模拟网络风暴:①背景数据风暴。利用网络测试设备FLUKEE网络通发送定制流量和帧长的单播、组播、广播网络报文,测试智能变电站各组网设备抵御各种网络风暴的能力。设计测试用例时覆盖单播、组播、广播各种通信报文,不同流量压力,不同报文帧长。②业务报文风暴。模拟交换机自环接线引起网络风暴。
3.2测试中的问题及原因
在测试中发现在过程层网络风暴和站控层网络风暴过程中某间隔层装置采样异常,且存在程序偶尔重启的问题。
对问题进行分析,主要原因有两点:一是由于程序中网络报文接收处理在中断中进行,优先级高于采样数据处理及保护逻辑处理任务,网络风暴过程中报文接收处理大量占用CPU资源,使低优先级任务得不到及时响应,进而导致装置采样异常保护拒动。二是风暴过程中报文量突增,甚至达100%线速,特别是当风暴中含有大量长帧报文时,需要申请大量内存对报文进行缓存处理,导致网络报文接收协议栈崩溃,进而导致程序异常。
3.3应对策略
3.3.1针对发现的问题采取措施:首先,合理降低网络报文处理任务的优先级,解决任务得不到响应的问题。站控层网络报文的接收处理和保护任务处理在同一CPU中处理,可将网络报文的接收处理放在低优先级任务中处理,优先级应低于采样值及保护逻辑处理任务,优先保证保护任务得到CPU资源。其次,对网络报文增加硬件过滤和网络风暴识别措施,避免网络风暴对CPU的冲击,解决网络风暴导致协议栈崩溃的问题。
3.3.2网络报文的硬件过滤和风暴识别方法。以太网卡在接收报文后,由网络驱动程序将报文传给通信协议栈,报文经过通信协议栈的处理传递给应用层程序,由应用程序决定丢弃或者响应。为了避免网络风暴对通信协议栈的冲击,可在网络报文进入通信协议栈之前增加以下措施:
①合理设置以太网卡工作模式,对报文进行硬件过滤,从源头杜绝无用报文进入装置。
以太网卡主要有以下工作模式:A.广播模式;B.组播模式;C.所有组播模式;D.单播模式;E.混杂模式。根据本文对智能变电站过程层、站控层网络报文通信方式分析,与过程层网络连接的设备网卡可设置为组播模式,对组播报文通过哈希算法进行硬件过滤;与站控层网络连接的设备以太网卡接收模式应包含单播模式、广播模式和组播模式,实现对单播报文、广播报文的接收,并对组播报文通过哈希算法进行硬件过滤。
②在网络驱动层进行网络风暴识别,避免风暴对通信协议栈的冲击。网卡对报文进行硬件过滤后,先由网卡驱动程序按照报文目的MAC地址进行判别是否存在网络风暴,如果某目的MAC报文存在风暴,可将报文直接丢弃,避免风暴报文对通信协议栈的冲击;如果组播和广播报文同时存在风暴,可认定为网络存在环路,可短时停止网络报文接收,如果连续判别风暴,则一直停止接收网络报文。对于站控层双网系统,主站检测到某一网络通信中断,会自动切换至另一套网络运行。此方法的关键是网络风暴的识别,可根据网络风暴的特点来合理设置识别判据。网络风暴的特点是报文流量较之风暴前突增。网络风暴识别的判别时间窗不宜过长,以方便精确统计报文频率,风暴识别的判别门槛可按照报文类别分别设置。
结论
本文通过实际测试验证了网络风暴对智能变电站组网设备的影响,提出了对网络风暴报文进行硬件过滤和风暴识别进而避免网络风暴冲击的方法,并经测试验证改进效果良好。
参考文献
[1]国家电网公司.Q/GDW428-2010智能变电站智能终端技术规范[S].2010.
[2]欧阳帆.智能变电站通信网络阻塞故障及其防范措施分析[J].电网技术,2011.
[3]周旭峰.交换机流量限制技术在智能变电站中的应用[J].电力系统自动化,2014(18).
作者简介
高保泰(1985.11),男,宁夏固原人,宁夏大学电路与系统专业工学硕士,单位:宁夏电力公司固原供电公司,研究方向:智能变电站网络风暴产生的原因分析
论文作者:高保泰
论文发表刊物:《电力设备》2015年7期供稿
论文发表时间:2016/2/2
标签:报文论文; 网络论文; 风暴论文; 变电站论文; 智能论文; 设备论文; 交换机论文; 《电力设备》2015年7期供稿论文;