摘要:随着新技术与新业务应用的不断深化,传统信息系统运维工作面临系统结构复杂、设备规模大、运维人员少、支撑工具多等问题。为提升运维服务质量,降低维护成本,提前发现运行隐患,文章从数据收集、维护处置、辅助决策等方面提出了信息系统运维自动化的思路。首先从运维数据采集、汇总、存储及分析方面实现数据收集自动化,再利用现场事件处置、配置变更、故障诊断以及辅助决策自动化技术实现对运维体系的有力支撑,使运维工作重点向提升核心能力、全局分析、运维决策、优化性能与服务及扩大投资收益等方向转变,实现运维管理精益化、集约化和智能化的目标。
关键词:自动化;运维体系;精益化管理;信息系统
随着电力企业信息系统的不断增加与完善,信息化工作重心由建设阶段逐渐向运行维护阶段过渡,信息系统运维与安全压力日益显现。但是,在传统的运维方式下信息系统运维工作主要由人工完成,部分相关运维工具由于功能分散、实用性低等问题,很难实现运维自动化处理,对系统配置也不能达到及时、准确、闭环的管理要求。尤其是对于信息系统客户密集型的呼叫行业,信息系统运维工作面临设备多、系统规模大、实时性要求高、主业运维人员和运维工具少等现实情况,需投入大量的人力进行重复、繁杂的运维工作。
1 必要性分析
1.1 系统巡检质量较低,重复性工作量大。机房、设备、信息系统巡检大量依赖人工,巡检频率和准确性都有待提高,巡检历史记录大量为纸质记录或者独立文档,难以得到有效利用。
1.2 信息系统及软硬件平台异构性大。随着以网络、主机、存储的虚拟化为代表的云平台技术的发展,出现了传统主机存储架构和虚拟化分布式架构并行,虚拟化软件存在多种架构并存的情况,同时在信息系统建设过程中,更多的是考虑业务功能的实现,各套系统异构性很强,巡检内容、范围均有所不同,运维困难较大。
1.3 云环境下运行环境复杂,运维难度高,运维操作作业自动化支撑不足。云环境下,运维的设备、资源、对象等数量大、技术难度高,如按传统手工排除故障、系统更新、部署、补丁下发等工作方式,费时费力而且非常容易出错;业务系统在云环境下的全生命周期管控缺少信息化工具支撑,无法对业务应用在云环境下的的一系列应用构建、部署、诊断、检修、监控、调控和优化等操作作业(服务)进行流程化、自动化和全程化管控。
1.4 业务连续性保障支撑不足。由于自身业务系统中断,影响本业务系统用户正常使用,另外因为业务系统间的各种关联集成关系,会受影响的其他业务系统范围未知,被影响的用户群体未知。
2 业务需求
2.1 主机利用率提升。随着资源池规模的逐步扩大,机房空间限制、虚拟化技术限制等问题日益突出,单个主机资源的利用率有待进一步提高,以满足单个主机能够运行更多的虚拟机的需要。
2.2 运维效率提升。现有资源池业务应用系统部署时,存在大量重复的安装部署及配置信息系统自动化运维研究工作,业务系统的安装部署及配置过程有待简化。
2.3 异构环境应用部署和迁移。业界采用Docker技术有效解决了运行环境差异化问题,使配置及发布更为便捷,同时DOCKER实现了更轻量的虚拟化,节省了虚拟机的性能损耗。当前资源池虚拟化架构,业务应用系统所涉及的操作系统镜像文件大,导致系统迁移部署复杂,尤其是针对异构平台的迁移,存在技术难点。
2.4 业务系统拓扑关系梳理。现有业务系统大部分已在资源池中部署运行,业务系统以多节点或单节点的方式在资源池中的虚拟机上部署,而当资源池中某业务系统节点发生故障时,运维人员无法及时掌握此节点属于那个业务系统,并且无法明确与相关业务系统的逻辑关系,不能鉴别其影响范围,无法快速对相关业务系统作出应急处理。
期刊文章分类查询,尽在期刊图书馆
2.5补丁分发与版本控制。由于当前沒有统一的管理界面及管理手段,在补丁升级、补丁版本回溯及准入校验时,没有相应的管理规范及监督手段支撑,往往采用运维人员根据以往经验进行相关操作,一旦出现问题,在追溯问题原因及解决问题效率上都有极大难度,费时耗力。
3 预期效果
3.1 经济效益。通过云运维自动化技术的应用,将大量的运维工作都通过软件的方式自动完成,可有效降低运维工作的复杂度及运维人员的工作量,提升工作效率的同时大大降低了运维成本。
3.2 管理效益。实现IT信息化运维自动化,提高业务系统性能、安全性及业务系统扩展性,提升运维工作的整体质量;将运维工作各个环节进行标准化、规范化,通过系统程序按照既定步骤自动执行,从而完成运维相关工作有利于公司建立标准化、规划化的信息化运维工作制度及工作流程。
3.3 社会效益。服务意识由被动运维向主动运维转变,强化面向内外部用户服务意识,加强服务运维导向,完善系统分级服务水平,提供给用户全过程体验;通过云计算、虚拟化新技术的应用,推动专业发展的同时引领驱动公司发展。
4 信息自动化目标
4.1 施行自动化的全面监控,对环境、设备、数据库等进行全面监控,形成一个可以不依靠有线连接起来的系统无论是数字集合还是其他方面,都会是自动化的。为不同的运维人员尽量提供不同地点的统一的工作平台,促进信息系统运维平台的研究与应用的科学化管理。
4.2 自动化操作的关键是操作方案操作流程是否合理完整,我们通常会考虑运维的需要和对象的特性,然后根据这些决定如何绘制脚本、建立脚本库。实行运维操作,有一个方法就是可以通过可配置的惯性,将多个基本的运维操做连起来构成一个自动操作流程。为了完善录入的信息,我们采用客户端和非客户端这两种模式进行信息采集。对于服务器,那采集办法就是客户端了,对于储存设备,非客户端就是比较适合的选择了,利用远程访问来采集信息,这种方法受网络管理协议的保护,所以不用担心协议问题,所以选择适合的采集方法也很重要。
5检查注意
5.1 一切都要主动的去做,自动发现找到构建网络使用者的ip、mac这样的连接位置,确保任何时刻都可以查到这些资料信息就再好不过了。通过绑定地址的方法,发现一些违法私自更改IP的行为,并加以组织,然后根据不同的需要在系统中设置用户,并设置不同的权限。幕后最终管理者可以控制这些网络,,手动或者自动将非法的设备隔离出去。
5.2 安全预警根据当时的形势分析结果建立适应的设定模型,为的是利用现有系统能采集到的指标对象对危险报警进行调整,并且在一系列实验过程中,安插一个报警预警,不仅可以细化到某个进程的电上,还要定期的进行检查,以确保数据出现变动的时候能够及时发现应对,真正做到“事前管理”。
6 结语
随着智能电网的高速发展和革新,电力信息系统的自动化运维平台的要求越来越高。信息系统自动化运维平台的研究与应用将在日常运维工作中提高很大的工作效率,由自动化取代了手工化,不仅仅提高了效率,还节省了生产资金,而且,排除了人为的不定性因素,整体的可靠性也提高了,这种操作有利于及时的掌握信息系统和设备的运行是否正常信息。绑定运维操作标准,提高运维工作效率,为企业信息化按照所需要的要求迈进,信息自动化的优化与发展维护不仅仅只是一个维护的过程,更是一个管理提升的过程,是现代信息系统发展的必然趋势。
参考文献:
[1]夏薇.企业信息系统相关自动化运维工具研究[J].电脑知识与技术,2018(07).
[2]李阳,孙中良,互联网时代的网络自动化运维[J].IP领航,2014,(4):30-36
论文作者:王逸帆,刘同同,胡洋,朱银珠,薛彦召,马仲涛
论文发表刊物:《基层建设》2019年第20期
论文发表时间:2019/9/20
标签:信息系统论文; 系统论文; 业务论文; 工作论文; 操作论文; 设备论文; 资源论文; 《基层建设》2019年第20期论文;