电力公司重要信息系统不停运检修技术研究论文_马国雷,王丹,韩宝卿,秦浩

电力公司重要信息系统不停运检修技术研究论文_马国雷,王丹,韩宝卿,秦浩

(国网青海电力信通公司 青海西宁 810008)

摘要:随着公司“三级五大”体系建设及SG186工程的实施,国家电网公司信息化建设得到了长足发展。信息系统对公司整体的生产经营管理工作的支撑作用越来越大,信息系统的连续高可用目标与现有技术手段保障能力以及业务管理模式之间的矛盾也将日益突出。本文立足信息系统运维检修实际,研究如何利用不停止应用服务的检修技术来提高系统连续利用率。

关键词:信息系统;不停运;检修。

目前国家电网公司信息系统运维检修总体以计划性检修为核心,以年度运行方式为总纲,月度检修计划为基础,辅助周计划以及临时性检修开展整体信息系统的运维检修工作。该模式在信息系统监控手段有限、自动化采集程度不高的条件下,具有较好的实用性。

随着公司信息化应用的不断深入,信息系统在公司整体的生产经营管理工作中的作用不断提升,信息系统的连续高可用目标与现有技术手段保障能力以及业务管理模式之间的矛盾日益突出。对于重要信息系统,如何利用不停止应用服务的检修技术来提高系统连续利用率,是公司系统检修工作要深化的一个重要技术更新。

一、研究内容

信息系统不停运检修是指信息系统检修期间系统功能无离线、无闪断、用户无感知,业务流转无缺失、数据无丢失,具备检修短(开发、测试周期短)、平(检修期间业务系统平稳)、快(检修发布完结快)等特点[1]。

基于信息系统建设运维工作现状,通过典型重要信息系统的部署架构现状梳理、统计分析系统检修工作特点,从硬件、数据库及应用系统三个层面分别研究如何在保障信息系统不停运情况下开展检修工作的策略与方法,形成对国网公司各信息系统不停运检修模式的优化提升建议。

二、信息系统检修现状

分别选择ERP和PMS2.0作为成熟套装软件和自主研发系统的代表分析研究,有如下的结论:

自主研发系统整体架构复杂,系统设计主要关注满足业务功能应用,缺乏针对系统运维的统筹设计、规划,系统运维检修任务大量伴随人工化操作,一定程度上人为的失误率被扩大化,运维人员技术水平依赖性强,重复工作量大,检修效率低下,检修可靠、可用性保障不足,且大量的系统检修任务由业务需求变化而触发,各应用模块陪停现象较为严重,极大程度降低了系统的用户体验值。

成熟套装软件形成了标准化的架构及软件部署模式,具有高度自动化的应用变更发布机制,保障了应用频繁变更发布的高效率与高可靠性,需求变更发布不影响业务的正常应用,只有极少数涉及数据库核心及底层硬件变更、整体软件大版本升级以及核心补丁升级情况下,才需要整体服务停机检修。

三、引进路线

(一)不停运检修技术展望

通过对自主研发系统及成熟套装软件的研究,今后可在数据库部署方式、硬件部署方式、网络架设方式、终端访问方式、调度监管方式、检修人员配合方式等方面开展信息系统检修技术研究和提升。

1.数据库云化

目前,大型信息系统数据库部署多采用双机RAC、单存储模式,一旦受到黑客、病毒等恶性攻击将造成数据存储异常,从而导致生产数据毁灭性的遗失,对整体电力业务生产将产生无法补救的损害,而具备高可靠性、高通用性、高可伸缩性、极其廉价等特点的云技术是提升数据库部署方式的“强心剂”。

2.主机部署虚拟化

目前,大型信息系统多采用实体机部署,一旦硬件磁盘、CPU或者操作系统出现故障,将引起全面的服务离线、功能瘫痪,而服务器虚拟化技术可以在现有计算资源投资的基础上节约大量的时间和金钱。

3.网络方式变革

传统信息网络多采用星状网络,星型拓扑结构相对简单,便于管理,建网容易,是目前局域网普采用的一种拓扑结构。但是需要耗费大量的电缆,安装、维护的工作量也骤增;中央节点负担重,形成“瓶颈”,一旦发生故障,则全网受影响;各站点的分布处理能力较低。

期刊文章分类查询,尽在期刊图书馆因此针对主干网络,开展多环路的网络建设,大力推进高性能、大带宽、虚拟化网络技术建设。

4.终端访问智能化

生产系统终端多采用PC台式机访问,极大程度限制了办公的灵活性和用户问题响应、处理的实时性,因此在网络多元化建设的同时配套升级终端访问方式,由固定、单一的终端访问方式向多元化、智能移动终端的服务覆盖,全面提升信息化办公服务的人性化、数字化、智能化和时尚化。

5.调度监管可视化

建立应用服务的可视化调度监管,大型信息系统内部应用服务众多,服务之间依赖关系复杂,系统检修过程相对繁琐,技术、技能要求高,易学性可传承性相对较差。因此为提高检修可操作性、提升易学性和可传承性、简化操作过程、提升检修可调度性,需要建立应用服务检修的可视化调度监管,通过应用服务检修调度管理,可以降低运维人员技能要求,大大缩短检修培训学习周期,大幅提升检修自动化水平,减少人工误操作风险。通过服务检修的可视化调度管理,可以实现所有单节点服务的自动化式、规范化启停,可以监控所有节点运行健康情况,可以实时监控各节点服务运行指标,实现操作、监控、运行的高度集中化调度操作。

(二)不停运检修演进路线

根据上述各类型不停运检修技术的展望,建议对于大型重要信息系统,按如下路线开展技术方面优化改进:

1.推广分布式存储技术,解决目前集中存储系统的单点问题,建议安排专项课题研究国网公司范围内的网省、总部的分布式存储下的高可用性架构优化策略。

2.目前各重要系统,主要基于国网统一开发平台,建议在应用平台层,考虑对系统运维功能的支持,研究自主研发系统的开发环境—>测试环境—>生产环境,应用变更的自动化更新传递机制。

3.大型应用系统往往由各类众多应用服务构成,目前系统应用服务之间的依赖关系没有清晰的展现,建议在监管系统中,增加业务功能依赖关系描述,实现应用服务故障影响范围评估功能,具备局部功能检修的运行方式自动化调度功能,通过应用检修的运行方式调度缩减业务需求更新导致的停运范围。

4.进一步明确重要应用系统生产环境架构的冗余配置,避免由于软硬件资源、项目工期等原因造成单点运行,提升应用服务保障能力。

四、工作建议

1.应用部署程序包有效“瘦身”

为发挥不停运检修发布实施“快”的特点,信息系统应用部署程序包建议控制在300M以内,最大不超过500M。程序包超过1G必须整理剔除第三方、版本重复及无用备份包,无法有效“瘦身”建议进行服务化拆分。

2.不停运检修实施时长要短

不停运检修实施期间单节点的长时间离线或将对存活节点造成流量高压,因此不停运检修单节点启停应严格控制在10分钟以内。

3.充分利用自动化发布工具

为规避人工可能出现的误差性批量操作,应选择安全有效的自动化发布工具或使用已有中间件的自动化检修功能。

五、结语

分别选取ERP和PMS2.0系统作为成熟套装软件和自主研发系统的代表进行不停运检修技术的研究,梳理了信息系统检修工作现状,研究如何在保障信息系统不停运情况下开展检修。该研究工作对各类信息系统不停运检修模式开展有较好借鉴意义,能明显优化提升应用发布的检修作业模式,较好提升业务应用的体验,后续需持续推动,切实推进“云化技术”架构优化的落地。

参考文献:

[1]王建伯.信息系统不停运检修技术在电网公司的研究与应用.工程技术.2017(344):54-55.

作者简介:

马国雷(1981年生)、男、国网青海省电力公司信息通信公司、810008、高级工程师、组长、硕士研究生、从事信息系统运维检修。

论文作者:马国雷,王丹,韩宝卿,秦浩

论文发表刊物:《电力设备》2018年第15期

论文发表时间:2018/8/21

标签:;  ;  ;  ;  ;  ;  ;  ;  

电力公司重要信息系统不停运检修技术研究论文_马国雷,王丹,韩宝卿,秦浩
下载Doc文档

猜你喜欢