摘要:文章归纳并论述SDH传输系统故障排查的原则、方法和处理步骤;通过专网故障处理的实例,分析论述处理业务中断和误码两大类故障的排查过程,重点分析不同方法在故障排查工作中的灵活及其效果。
关键词:光传榆;故障处理 SDH
我们知道当今社会是信息社会,高度发达的信息社会要求通信网能提供多种多样的电信业务,通过通信网传输、交换、处理的信息量将不断增大,这就要求现代化的通信网向数字化、综合化、智能化和个人化方向发展。而SDH传输系统是通信网的重要组成部分,传输系统的好坏直接制约着通信网的发展。故障的发生将不可避免,它直接影响到各运营商的业务,造成严重的经济损失。因此,必须在日常的SDH维护工作中制定出一套故障处理的流程和方法,来指引我们快速、精准、有条不紊地进行排查,将损失减少到最低。
1 故障处理前的准备
SDH系统故障处理主要是对光线路和设备的检查及操作,运行维护人员必须熟知系统的各方面情况才能做好故障处理工作,具体如下:
1.1、熟悉SDH原理知识,了解传输系统告警信号流及告警产生机理。
1.2、熟悉所维护系统的管理和运行状况。主要是设备和网管的操作,能够迅速做好故障现场数据的采集与保存;同时熟悉设备配置情况、机盘功能、接口情况、面板上各种告警灯和指示灯的显示情况。
1.3、熟悉工程组网信息,包括网络拓扑、业务配置、设备运行状态,以及相应工程文档的存放位置,能够迅速做好故障现场数据的采集与保存。
1.4、熟悉常用仪表、工具的基本操作。SDH光传输系统常用仪表有:光功率计,光时域反射仪(OTDR),误码仪,2M话路分析仪等。
2 根据告警信息定位故障的处理方法
2.1 网管上报单站丢失,光板断纤告警信息
按照网管上报的告警信息,显示某网元监控数据丢失,无法对其操作配置,承载业务中断,此故障定义为业务中断类;可能有三种原因;第一、外部原因,包括供电电源故障、接地故障、环境异常、光纤、电缆故障;第二、人为原因,包括误操作设置了光路或支路通道的环回,误操作更改、删除配置数据,设置业务未装载;第三、设备本身故障,单板失效或性能不好。
2.2 网管上报某网元有误码告警信息
此故障现象时断时续,时好时坏,我们将其定义为误码类故障;同样可能有三种原因;第一、外部原因包括光功率问题、接地故障、环境温度、电缆故障、设备外部干扰;第二、人为原因,时钟配置错误;第三、设备本身故障、单板失效或性能不好(交叉、时钟、线路、支路)。
期刊文章分类查询,尽在期刊图书馆
3 故障处理分析
3.1业务中断类故障
对业务中断类故障,首先分析外部原因,典型的检查次序是:供电电源、接地、环境异常、光纤或电缆故障。其次分析人为原因,如误操作设置了光路或支路通道的环回,误操作更改、删除配置数据,设置业务未装载等。也可能是设备本身故障,如单板失效或性能不好。
定位方法可以采用告警分析法、逐段环回法、替换法和更改配置法。定位的步骤可具体为:检查各站登录是否正常,检查有无设备告警;检查保护倒换是否正常;分析故障,即通过环回或更改配置定位到单站;将故障进一步定位到设备板卡并解决。
根据故障情况进行分析,首先应排除因线路自动保护倒换(APS)启动不成功所造成的业务不通的情况。查询告警并检查倒换状态,若系统未进行自动线路倒换,应检查APS协议是否启动,必要时重新配置并下发MSP参数,并重新启动APS协议,直到线路保护倒换成功执行。
在保护倒换执行的情况下,仍存在E1业务中断,则应首先画出倒换后的信号流,并采用“逐段环回”或“更改配置法”将故障定位到单站。
定位过程中,也可以采用“更改配置法”,使得该广播业务能够遍历相关支路板、交叉板和线路板,根据每个网元的业务接收情况来判断故障点的位置。
3.2误码类故障
造成误码类故障的原因一般分为外部原因(如光功率问题、接地故障、环境温度、电缆故障、设备外部干扰(瞬时大误码))、人为原因(如时钟配置错误),或设备本身故障(交叉板、时钟板、线路板或支路板单板失效或性能不好)。处理方法也可以综合应用告警性能分析法、更改配置法、逐段环回法和替换法。
4 设备网管处理过程
(1)查询设备上SL4单板条码发现该单板是新发货单板,排除芯片问题引起的告警锁定。(2)查询纤缆连接,收发都正常,且纤缆连接没有问题。(3)查看倒换情况,从网管的告警信息来看倒换正常,两端的参数设置也没有问题,进而需要考虑是不是业务配置方面有问题。(4)用命令行查询站点业务发现支路业务配置在无保护的sys2上,但没有复制到sys1的业务,此处的业务配置有问题。咨询客户后发现客户在节点配置数据步骤上出现问题,客户先配置了两个无保护逻辑系统,然后就配置了支路板到sys2的业务,最后才配置了1+1线性复用段,即目前设备上所运行的业务属于无保护业务。当节点设备掉电重启后,站点的槽位SL4单板上报R_LOS告警,现场查询历史告警信息,发现上报时间有差别,槽位单板先于槽位3秒上报R_LOS,复用段倒换是毫秒级的,于是两点之间发生线性复用段倒换,节点倒换到槽位接收业务。由于配置的是单段不恢复式,所以将一直从槽位接收业务,而此时节点并没有发往1-OI4的业务,导致节点收不到业务而上报TU-AIS告警。客户在节点将相关业务重新激活后,节点将从SL4接收业务,此时业务可以通。
参考文献:
[1]周晓民,王永平,靳秀峥,等.SDH 光传输系统培训手册[M].深圳:华为技术有限公司编辑出版中心.1999:1-4.
[2]肖萍萍,等.SDH 原理与技术[M].北京:北京邮电大学出版社,2002:10-12.
[3]曾甫全,李勇,王河.光同步传输网技术[M].北京:北京邮电大学出版杜,1996;18-38.
[4]邓忠札,赵晖,等.光同步数字传输系统测试[M].北京:北京人民邮电出版社,2001:52-54.
论文作者:张家庆
论文发表刊物:《电力设备》2018年第15期
论文发表时间:2018/8/17
标签:故障论文; 业务论文; 单板论文; 设备论文; 支路论文; 原因论文; 节点论文; 《电力设备》2018年第15期论文;