浅析网络故障的计算机智能管理与处理措施论文_徐大海

浅析网络故障的计算机智能管理与处理措施论文_徐大海

北京欣智恒科技股份有限公司 徐大海

摘要:网络故障管理是计算机网络管理中一个重要的功能,用户在正常使用计算机网络的时候,如果网络发生故障必然会影响用户,因此,网络管理器需要快速查找故障并排除故障。为了降低网络故障的发生频率,制造方或运营商通常会在系统内引入或根植相关的人工智能技术,这样不仅能够使得网络故障的检测及管理水平有所提高,而且其在系统的可靠运行方面也起到了非常重要的作用。

关键词:网络故障管理 计算机智能化 管理方法

网络故障管理是计算机网络管理中一个重要的功能,用户在正常使用计算机网络的时候,如果网络发生故障必然会影响用户,因此,网络管理器需要快速查找故障并排除故障。故障管理的任务就是查找故障和排除故障。故障管理包括故障管理、故障恢复和预防管理。故障管理的内容包括故障警告、故障测试、故障诊断及设备更换等。由于网络故障的出现具有一定的复杂性因素,其通常是由于系统区域内不同功能的网络部件共同作用的结果。在进行网络故障的分析及管理时,应对系统构建的网络进行必要的修复,最后,为了确保故障的完全修复,还应实时的分析网络故障产生的原因。通常情况下,系统内的日志文件主要负责网络中轻微故障的记录工作,而当严重故障发生时,系统内置的报警机构将会发出警示信号,以通知网络管理器进行实时的处理和防范。现阶段,为了降低网络故障的发生频率,制造方或运营商通常会在系统内引入或根植相关的人工智能技术,这样不仅能够使得网络故障的检测及管理水平有所提高,而且其在系统的可靠运行方面也起到了非常重要的作用。

一、网络故障原因及相关应对措施分析

日常维护可以有效地保证网络稳定地运行,减少错误。但是,由于网络设备、用户使用、应用程序及网络规划不尽完善等问题的不可避免性,不论日常维护工作做的如何好,网络还是会出现问题。网络系统涉及面十分广,有网络硬件、网络软件、计算机、打印机、应用程序等等,当网络系统中出现故障时,首要的原则是隔离网路问题,判明问题的原因,然后才是解决问题。在分析网络常见问题的起因和具体解决方法之前,要先弄清网络故障产生的原因,找出故障应该从哪几个方面着手:

缩小故障的范围。可以用以下方法发现故障设计的范围:根据出错信息判断;判明故障发生在一个工作站,还是几个工作站,还是文件服务器;判别故障的类型是打印问题,通讯问题,还是应用程序问题等等。

检查硬件设备。如果故障出现在一个设备上,可以将这台设备隔离开来单独运行,或将外设挂到一台正常的机器上运行,如果这时该设备出现同样的故障,表示这台设备本身有问题,与网络无关。如果发生故障的各个设备单独运行时都正常,则说明问题出在设备与网络的联接方面。

期刊文章分类查询,尽在期刊图书馆

故障发生时,屏幕上经常会出现“出错信息”可以查阅《系统信息手册》找到出错原因。

经过第2步,确认故障不是计算机,外设本身的故障,而是网络方面的问题后,根据第3步进一步缩小可能发生故障的范围。如果是网络硬件问题,可以确定可能有故障的各种设备,如网卡、BNC头,HUB、双绞线、同轴线、终结器或线路接触不良等等。先对最便宜的设备进行更换,更换后如果故障仍存在,则更换稍贵些的部件,依次类推。

总结修复经验,解决问题后,立即将修复经验和更换内容进行记录,已备类似问题出现时有据可依。

计算机智能管理系统分析为了能够更有效地对各种大型复杂的网络进行管理,许多研究人员将人工智能技术应用到网络管理领域。虽然全面的智能化的网络管理距离实际应用还有相当长的一段路要走,但是在网络管理的特定领域实施智能化,尤其是基于专家系统技术的网络管理是可行的。用于故障管理的专家系统由知识库、推理机、知识获取模块和解释接口四大主要部分组成。专家系统以其实时性、协作管理、层次性等特点,特别适合用在网络的故障管理领域。但同时专家系统也面临一些难题:(1)动态的网络变化可能需要经常更新知识库。(2)由于网络故障可能会相关到其它许多事件,很难确定与某一症状相关的时间的开始和结束,解释和综合消息复杂。(3)可能需要大量的指令用以标识实际的网络状态,并且专家系统需要和它们接口。(4)专家系统的知识获取一直以来是瓶颈所在,要想成功地获取网络故障知识,需要经验丰富的网络专家。

二、建立必要的事件知识库

在专家系统中,知识的表示有逻辑表示法、语义网络表示法、规则表示法、特性表示法、框架表示法和过程表示法。产生式表示法,即规则表示法,是最常见的一种表示法。其特点是模块性、一致性和自然。知识库是知识的集合,严格意义上的知识库包括概念、事实和规则只部分,缺一不可。为了提高故障管理的智能水平,可以建立事件知识库,用于存储所有已知事件的类型、产生事件的原因和所造成的影响,以及应该采取什么样的措施等一些细节的静态描述。这个EKB并不是真正意义上的知识库,它的数据仅仅包含了属性值与元组,而属性值表示概念,元组表示事实。但研究EKB可以为今后建立完善的知识库奠定基础。在EKB中存储了己经确定事件。最初,被确定的事件仅限于一些标准事件和措施。随着网络的运行和系统的反馈,EKB的内容将不断增加。理想状态是能够确定所有的事件。下面是EKB涉及到的只种基本的数据库表:(1)事件类型表:该表中主要存储了事件的静态定义;(2)实时事件表:描述了正在运行的网络中的实时事件;(3)设备信息表:存储了网络中设备的实际参数。EKB中存储的相关事件的知识主要来源于专家。开发人员将获得的知识应用到与故障管理相关的系统中,根据不同系统的需要分配相应的知识,以提高系统性能。虽然EKB并不是严格意义上的知识库,但在开发过程中,可以通过不断地增加和修正EKB的内容,在一定程度上提高系统的智能水平。

本文通过对网络故障原因及相关应对措施的分析,提出了将计算机人工智能及事件知识库的构件方案用于计算机网络故障的管理。通过大量的实践证明,这种用于网络故障管理的计算机智能化方案不仅比传统的管理方式具有更高的决策水平,而且还能大幅提高计算机系统在故障检测及隔离方面的效率。

参考文献:

[1]李华;智能化通信网络综合管理技术[D];电子科技大学;2011(04)

[2]张崇;计算机智能化网络管理浅析[J];科技与企业;2013(06)

论文作者:徐大海

论文发表刊物:《文化研究》2018年第10月

论文发表时间:2018/10/25

标签:;  ;  ;  ;  ;  ;  ;  ;  

浅析网络故障的计算机智能管理与处理措施论文_徐大海
下载Doc文档

猜你喜欢