摘要:DWDM波分复用系统是光纤通信传送网的重要组成部分,文章结合作者实际工作经验,从DWDM故障定位原则、定位方法和常见故障处置三个方面进行论述,为系统的故障处置提供了切实可行的参考。
关键词:光纤通信;DWDM波分复用;故障处置
引言
随着DWDM波分复用设备(密集波分复用)在骨干网络中不断投入使用和升级扩容,承载的业务越来越多,为数据、语音、视频等业务提供了大容量的通道。在设备运行过程中,由于工程施工、设备故障、外部因素、操作不当等原因造成的各类故障问题,对整个传输网络造成巨大影响,必须迅速定位故障点,准确判明故障原因,及时排除故障恢复设备运行。
一、故障定位的原则
DWDM波分复用系统故障定位一般遵循“先外部因素,后波分系统;先定位单站,后定位单板;先主光通道,后个别波道;先高级告警,后低级告警”的原则。
(一)先外部因素,后波分系统
在查找DWDM系统故障原因时,应首先排除外部的可能因素,如光纤阻断、交换故障、接地问题或电源问题等,再考虑波分设备的问题,尽量减少对站内设备的误操作,避免人为增加故障查找难度。
(二)先定位单站,后定位单板
由于传输系统各个站点之间的距离较远,因此在进行故障定位时,最关键的一步就是将故障点准确定位到单站。定位到单站后,再进一步确定站内单板故障,缩短处理时间。
(三)先主光通道,后个别波道
DWDM系统故障分为主光通道告警、个别波道告警和非业务性告警三类,主光通道告警经常会引起其他告警提示,对系统的影响比较大,属于优先处理方向。
(四)先高级告警,后低级告警
DWDM系统告警分为紧急告警、主要告警,这些告警都对通信有影响,必须马上处理。然后在分析次要告警和一般告警,并将相互关联的告警进行分类处理。
二、故障定位的常见方法
(一)告警性能分析法
当系统发生故障时,在设备和网管上将出现相应的告警信息,通过观察设备单板上的指示灯运行情况,可以及时发现故障,充分利用SDH和DWDM系统配置的网管功能,初步判断故障类型和故障点的位置。通过网管采集告警信息和性能信息时,必须保证网络中各网元的当前运行时间设置和网管的时间一致。
(二)仪表测试法
仪表测试法一般用于排除传输设备外部问题,为减小故障定位时对业务的影响,建议按照以下顺序使用仪表:①SDH分析仪。将SDH设备的远端自环,近端接SDH分析仪,判断误码来自SDH还是WDM。②光功率计。使用光功率计精确测量该点光功率。③光谱分析仪。用光谱分析仪测试单板的光口,直接从输出信号的光谱上读出光功率、信噪比,将得到的数据和原始数据比较,判断是否出现比较大的性能劣化。如果受到影响的业务是主信道的所有业务,重点分析合分波子系统单板的光谱;如果受损的业务只是主信道中的一路业务,重点分析光转发类型板、合分波子系统单板的光谱
(三)替换法
替换法是指使用一个工作正常的物件替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段尾纤、一块单板或一个设备。替换法适用于以下情况:①排除传输外部设备的问题,如光纤、接入设备、供电设备等。②故障定位到单站后,排除单站内单板的问题。③解决电源、接地问题。替换法操作简单,对维护人员要求不高,是比较实用的方法,缺点是要求有可用备件。
期刊文章分类查询,尽在期刊图书馆
(四)环回法
环回法是光传输设备定位站内故障还是站外故障的常见方法,当系统有误码不能从告警现象各性能数据中分析出来时,可采用业务信号逐段环回、远端环回与本地环回、收发单板环回等方法压缩排除故障,需注意的是环回法需要中断业务。
(五)配置数据分析法
设备配置变更或维护人员的误操作,可能会导致设备的配置数据遭到破坏或改变,导致故障发生。对于这种情况,可以通过查询设备当前的配置数据和用户操作日志进行分析,查清真正的故障原因。
三、常见故障处理
(一)业务中断类故障处理
1.业务中断故障现象及原因
业务中断故障的主要表现有业务不通,网管有告警;业务不通,网管无告警;主光通道或监控通道不通;多波长或单波长业务不通。业务中断故障的主要原因有供电电源故障;光纤、光缆故障;接地异常;网元、网管数据配置错误;由于误操作,设置了单波的环回;由于误操作,更改、删除了配置数据;单板失效或性能劣化;单板故障或自然损坏。
2.业务中断故障处理
首先排除外部原因。检查设备供电电源,如设备掉电,则该网元在网管上变灰,不可管理,该网元的上、下游网元对应单板上报无光告警,同时出现多波长、主光通道业务中断。检查光纤连接,确认光路连接正确且光板收发接口良好。检查网元的光功率,如果无光,或者光功率与正常值差异极大,证明线路有问题,调整光接口,观察告警是否消失。检查业务电缆是否有虚焊、漏焊、接触不良现象,用光时域反射仪进行测试,找出故障点,并进行相应的处理,如熔纤,观察告警是否消失。检查设备接地,可能是DDF/ODF架没有接地或传输设备和交换设备之间没有共地,从而存在较大的压差,该原因也可导致业务中断,网管上查不出告警和性能。最后检查网元配置数据。检查单波是否做了软件或者硬件环回,如果存在环回,则需要解除相应环回,否则做了相应环回的单波业务都会中断。检查网元配置数据是否配置正确。检查是否人为插入了告警,导致业务不通。
(二)误码类故障处理
1.误码类故障现象及原因
误码类故障的现象为OTU的输出光功率在短时间内有较大幅度的变化,网管上有误码性能及越限告警。故障原因主要有光纤插头不清洁、光纤性能劣化、损耗过高;设备散热不好,工作时间过长,工作温度过高;光纤插头连接不正确;光转发类型单板、汇聚类型单板故障或自然损坏;其他单板故障。
2.误码类故障处理
排除误码故障的思路是先排除外部原因,定位故障到再生段,然后到单站,最后定位到单板。误码类故障可采用观察分析法、仪表测试法、替换法进行处理。首先排除外部原因。检查线路收发光功率是否在指标范围内,如果输入光功率不正常则调整衰耗器或清洁尾纤接头。检查设备接地,检查设备的时钟配置是否正确,检查设备温度,检查设备附近是否有电磁干扰。然后查询误码检测数据或采用环回法判断误码故障的特点,将误码故障进行定位。确认故障属于单向误码还是双向误码,检查所有波长都出现误码还是仅是个别通道出现误码。若某站所有光转发类型单板、汇聚类型单板都有误码,可能是前面线路有问题或光放大类型单板、合分波类型单板存在问题。若只有某块光转发类型单板上报误码,可能是前一级光转发类型单板、汇聚类型单板传输性能劣化导致。通过环回定位故障到发端单板或者收端单板,更换相应的单板。
(三)光功率故障处理
1.光功率故障现象及原因
光功率故障主要表现为主光工作点平坦度较差;功率和信噪比参差不齐;光放大类型单板的增益值或输出光功率不正确。原因主要为尾纤因受到外界因素影响导致传输性能劣化。光纤线路损耗增大;操作不当致网管中数据被调整;设备的光发送模块故障;DWDM系统光器件性能劣化。
2.光功率故障分析与处理
首先排除因尾纤和合波类型单板输入光纤口故障的外部因素。然后检查OTU类型单板的输出光功率和中心频率,检查光放大类型单板的增益平坦度,检查网管上OA板的APC功能是否处于使能状态,检查网管上是否对OA板的增益进行调整,观察故障点单板指示灯的运行状态,同时查询网管的告警和性能数据,定位故障,直到光功率恢复正常。
结束语
设备维护人员要熟知DWDM基本原理、信号流和告警信息、熟悉网管和传输设备的基本操作,熟练掌握常见故障的处理原则、判断和处理方法,确保遇有情况能够准确判断,快速处置,提升传输系统稳定运行质量。
论文作者:刘小强
论文发表刊物:《基层建设》2019年第24期
论文发表时间:2019/12/9
标签:故障论文; 单板论文; 设备论文; 业务论文; 功率论文; 网管论文; 误码论文; 《基层建设》2019年第24期论文;