Abstract:This study analyses the current situation and problems of network management and maintenance, puts forward a new mode of network management and maintenance, constructs a network operation and maintenance management platform based on large data of information network, and explains the implementation of the platform, in order to provide some useful experience for similar network operation and maintenance management.
关键词:网络运维管理;精准运维;查询分析
Key words: Network Operations and Maintenance Management; Precise Operations and Maintenance; Query Analysis
引言
国网公司三届四次职代会提出要持续贯彻落实网络安全法,加快构建与“三型两网”企业相适应的网络安全防控体系,确保重要业务数据和客户信息安全,同时要建成信息高效处理、应用便捷灵活的泛在电力物联网。在此新形势、新背景下,对网络高效运维管理、网络持续安全运行提出了更高的要求,网络运维管理机制将不断接受挑战,因此需要重新审视现有网络管理机制,提出新的管理方式方法,确保电网、信息网络有一个稳定可控的运行环境。
一、现阶段网络管理维护中遇到的问题
在企业信息化不断普及和发展的过程中,计算机网络的规模越来越庞大,网络环境越来越复杂,给计算机网络的管理和维护带来了巨大挑战。虽然关于网络维护制定了各类标准和制度,但目前网络管理和维护依然严重依赖广泛的背景知识与大量的实际操作经验,主要有以下几个问题亟待解决。
1、现有网络管理系统欠缺部分功能
现阶段已有的各类网络管理系统的特点均为大而全,存在定位不够精准的局限,在实际故障处理过程中参考性不高。部分系统侧重于数据的全面,但对网络设备的连接情况不关注;另一些系统侧重于终端设备的安全管控,对资产的运行情况和网络设备的连接情况均不予关注。
2、故障处理时效性不高、新员工成长缓慢
目前网络管理主要依靠运维人员工作经验和对本单位网络的熟悉程度,新进员工和经验不足员工解决问题时不熟悉具体网络状况,故障查找、处理无从下手,制约各类故障排查处理的时效;人员技能的提升主要通过个人的努力学习或师带徒的手口相传,成长缓慢。
3、设备运维信息关联度不高
网络中的各类硬件资产状况信息长期处于分散的状态,各类表格资源关注点比较单一,关联度不高,无联动效应,经常需要人工反复排查、确认,信息共享度欠缺,造成各类系统在增加、更新数据时不一致,阻碍了基础数据的准确、可靠;
4、新形势下网络安全出现新变化
国网公司三届四次职代会提出要建成信息高效处理、应用便捷灵活的泛在电力物联网。未来,接入网络的业务和终端体现出业务多元、边界复杂、数量众多、类型多样的特点,对网络高效运维管理、网络持续安全运行提出了更高的要求,网络安全管理机制将不断接受挑战,因此需要重新审视现有网络安全管理机制,提出新的管理方式方法,确保电网、信息网络有一个安全可控的运行环境。
二、构建一个网络管理维护精准运维平台
在长期网络运维管理实践基础上,将公司各类人员、网络设备、网络节点、业务运维等信息进行全面的梳理与整合,形成全面详细的信息数据池,基于信息数据池,研发精准运维平台。提出基于大数据的高效精准网络运维管理新模式、新方法,产生一个快速精准查询分析及整改于一体的多功能、多维度的运维管理平台。
1、构建四个基础数据库
(1)构建信息网络终端数据库
通过日常网络运维收集全网服务器、网络设备、安全设备、办公计算机、打印机、自助收费机、计量周转柜等各类网络终端设备的数十个字段,将收集到的数十万个数据形成信息网络终端数据库。
(2)构建IP地址段数据库
将全网数十万IP地址依据不同的使用需求个性化划分为数百个子网,分别提供给服务器、网络安全设备、网络设备及公司所属各个单位,形成一个IP地址子网数据库,该数据库内包含单位、子网号、网络地址、起始IP地址、终止IP地址、网关、段内地址数量等字段。
(3)构建网络节点信息数据库
网络中的各类设备通过一个或多个网络节点接入网络,收集各类网络设备、主机设备、安全设备的网络联接情况共数万条,形成一个设备网络节点数据库。通过网络节点数据库,让运维人员快速掌握设备连接情况,及时进行故障排查,提高运维效率。
期刊文章分类查询,尽在期刊图书馆
(4)构建典型故障排除数据库
网络及设备故障多种多样,并不是每一个故障都必须按部就班去查找、排除,收集和维护信息网络及网络中各类设备的故障排查和处理过程的案例资料,其中包含故障报修人及地点、IP地址、故障类型、故障现象详细描述、问题解决过程或步骤、特别注意事项等字段,以上信息形成故障排除数据库,通过这个故障排除数据库,可以调用类同故障排除步骤,快速发现故障点、排除故障,同时也可为运维人员提供一个学习交流的平台。
2、开发一套精准运维平台管理软件
编写一套基于C/S(客户端/服务器)架构模式的软件。提供数据变更、新增接口,在日常的维护中不断更新相关数据。
基于上述四个数据库实现各类字段的独立或联合查询索引。利用某字段对各类网络终端设备的查询,快捷获知网络终端设备详细信息;利用网络设备节点的查询,快捷获得指定网络节点拓扑结构;利用典型故障解决方案的查询,快捷展示历史同类故障解决方案;且可提供的个性化交叉查询、展示、导出。上述功能的实现极大缩短了网络故障点的排查和故障处理时间,即使是新进员工或不熟悉网络的人员也可快速了解具体情况并找到一般故障的处理方法。
3、利用精准运维平台进行各类分析
(1)精准显示网络安全评级,高效开展安全管控
利用网络终端入网频率、变更频率、弱口令发生次数、违规软件安装、防毒墙及桌面管控客户端安装等安全风险指数,综合评判该单位或终端使用人的安全评级,根据安全评级向特定个人办公计算机推送风险警示,同时列入重点观察对象,针对性的进行网络安全告知及特殊管控,降低安全事件的发生率。
(2)精准呈现设备分布形态,合理开展设备分配
国网公司将办公用计算机配置标准分为资源型(A型)、标准型(B型)、作业型(C型)三类,利用平台内数据分析不同类型的计算机在各单位中的数量、比例,综合分析得到统计数据,为年度计算机分配提供数据基础。
(3)精准感知网络资源态势,超前开展日常运维
利用IP地址占用情况分析各网段IP地址现状,预判某网段网络地址资源是否枯竭;利用网络节点连线数据分析网络配线架、交换机端口等网络资源是否已使用完毕,需要增加网络配线架或交换机;同时可为今后的信息化项目储备提供基础数据依据,为日常运维工作打好提前量。
(4)精准评估设备故障风险,及时开展针对运维
利用平台内数据分析某多发故障存在于哪些地点、哪些部门、哪批计算机、哪类人群或哪个网络区域,有针对性的开展后续运维,防止故障蔓延,间接降低运维工作量。
三、创新点
1、网络故障精准定位
利用平台内的网络连线模块,对出现网络故障的设备进行远端排查,快速定位故障发生点,极大缩短故障处理时间,提高网络故障处理时效。
网络风险精确预判
利用平台内的安全分析预判模块,对设备入网频率、变更频率、弱口令次数、违规软件安装情况等数据综合分析,可提前知晓存在高等级安全风险的地点和人员,及时开展风险预警和安全管控。
3、运维经验精细传递
利用平台内的故障信息模块,快速了解历史同类问题解决方案,新员工在排除故障的同时进行了实际操作和理论学习,缩短了技能掌握时间,加快新人员成长速度。
四、产生效益
该系统实施以来解决了4个方面的问题:
1、长期以来新入网设备管理不够条理,网络运行存在不小的安全风险,有效提升本质安全水平。
2、故障线路查找耗时耗力,解决信息网络故障排查、处理长期依赖人员技术水平及工作经验,降低人员重复工作时间。
3、解决设备资产运行年限不清、计算机分发无可靠依据,为年度计算机分配提供准确的资产使用信息。
4、解决新入职员工及运维经验不足的员工处理各类信息系统故障无从下手、处理不当的问题,新进员工和不熟悉信息网络的人员可根据平台提供的各类信息快速定位、处理故障,形成一个运维经验快速传递平台。
参考文献
[1] 王灵霞,刘永纯.网管员典藏书架:网络管理与运维实战[M].中国铁道出版社.2016
[2] 网络安全和信息化杂志社.网络安全和信息化[M].电子工业出版社.2017
[3] 阮晓龙,许成刚.网络构建与运维管理[M].中国水利水电出版社.2016
作者简介
李 斌(1981-),男,山西晋城,高级工程师,从事于网络安全管理工作.
张跃斌(1975-),男,山西晋城,工程师,从事于信息安全管理工作.
郭锫骐(1989-),男,山西长治,工程师,从事于终端安全管理工作.
申文栋(1978-),男,山西长治,高级工程师,从事信息通信管理工作.
张艳菲(1987-),女,山西晋城,工程师,从事于终端安全管理工作.
袁亚琴(1990-),女,山西晋城,工程师,从事于终端安全管理工作.
张 豪(1994-),女,山西运城,无,从事终端安全管理工作.
论文作者:李 斌 张跃斌 郭锫骐 申文栋 张艳菲 袁亚琴 张豪,
论文发表刊物:《当代电力文化》2020年1期
论文发表时间:2020/5/6