中国联通IT运营平台建设思路探讨论文

中国联通IT运营平台建设思路探讨

杨洁艳1,李 衡1,莫 穹2(1.中国联通智能网络中心,北京100033;2.中讯邮电咨询设计院有限公司郑州分公司,河南郑州450007)

摘 要 : 互联网+时代对传统运维带来新的挑战,维护单位需要做好数以万计的设备管理,实现设备故障快速定位,需要维护海量的设备配置信息,满足负责的业务服务以实现快速的业务响应,降低人工操作成本并保证支撑质量,做好相关运维资源的有效运营,是中国联通IT运营平台亟待解决的问题。从中国联通运维支撑系统建设现状出发,对中国联通IT运营平台建设思路进行探讨,从系统定位、能力需求,技术路线等多方面对平台功能需求、技术架构、系统框架等方面进行研究,进而提出相应的IT运营平台建设方案。

关键词: IT运营平台;建设;能力需求;技术路线

1 研究背景

经过多年的建设,中国联通已建成OSS2.0。作为集中化的运营支撑系统,OSS2.0形成了全网集中的智能监控、电子运维、移网业务保障、客服支撑等核心应用,具备全国统一的资源管理能力、全网O域大数据分析能力,有力支撑了全国运维工作的集约化改革,切实提升了网络运营效率与效益。

1.1 运维支撑系统建设现状

中国联通总部运维支撑系统现状如图1所示。其中应用和能力管控系统共有26个,控制层网管系统15个。

1.2 系统需求背景

中国联通IT运维现状如下:

为改善城市供热系统能源结构,提高清洁能源供热比例,各类热泵系统逐渐地用于供热系统中。污水源热泵系统为热泵应用的一种,以低品位热能作为热源,从污水管道中提取废热,通过污水换热器、水源热泵机组等主要设备,消耗少量的电能,从而实现供热的一种技术。污水源热泵的使用,可以减少颗粒物、二氧化硫、氮氧化物等污染物在城区内的排放,改善居民的生活环境,提升城市开发价值,促进城市发展。因此,对污水源热泵的利用进行了探讨。

a)缺乏统一的IT管控平台,每个系统对IT层面的管理水平参次不齐,独立维护。

b)管理单元突增,缺少配套的管理手段。

c)数据分散且无法动态准确维护,依靠人工台账进行管理。

d)维护单位人员之间在运维活动的协同基本依靠电话、短信及第三方通信软件沟通,无法做到历史留存以及运维闭环。

图1 中国联通总部运维支撑系统现状

e)虚拟化技术、云化技术、容器技术、集群化技术的应用导致监控采集数据海量增长,存储和计算能力不足,且缺乏有效利用。

f)运维工作不规范,缺少制度化和流程化的电子支撑手段。

g)大部分维护工作还是依靠维护人员手工操作,依靠运维人员的经验,效率有待提升。

h)传统相对静态的阈值设定方式,无法根据业务趋势变化而动态变化,导致预警不准确。

i)业务系统复杂度增加,伴随新技术的发展与应用,新生系统的部署与监控方式更加复杂,对监控策略及配置的灵活性要求更高。

(3)施工车辆可能对路面的结构造成一定磨损,因此在施工时,必须铺设临时通道,临时通道应设置在垫层和底基层,同时应该铺设一层石屑,厚度应超过4cm。在下一层的铺设之前,需要对其清扫,如果局部污染过重,应使用高压水枪对其进行冲洗。

j)随着SDN/NFV、5G、物联网、AI、NB-IoT等新技术不断发展,业界标准组织、国内外运营商等,也积极进行着网络转型及下一代运营支撑系统的研究,中国联通也提出了5G战略、CubeNet2.0战略、物联网+战略等积极适配网络的转型。从业务角度,也向下一代运营系统提出了新的需求,面向管理,需要实现数据端到端的闭环呈现及管理;面向客户,需要提供按需随选的服务,实现实时响应、操作便捷;面向运维,需要提供自动化、智能化的运维保障支撑,以缩减人工,简化流程、缩短处理时长。网络新技术的演进、运营的变革以及IT技术本身的发展,使得未来运营系统应具备“智能运维、网络使能、能力开放、业务编排”特征,以便更充分地发挥未来网络的技术优势,支撑整体网络效率的提升。

2 建设思路

2.1 技术要求

IT系统在迅猛发展的同时,对于IT系统的运维管理的要求同步发展。最早期缺乏有效运维系统支撑时依靠人工方式,维护效率低下、错误率高,后来有了ITIL(information Technology Infrastructure Library)开始成体系地进行运维管理,缺点是流程较长、效率低下。再后来从被动运维向主动运维转换(ITOM),敏捷开发与自动化运维相互结合的开发运维一体化(DevOps),运维大数据分析辅助运维决策(ITOA)。目前运维领域正尝试将人工智能技术引入运维管理,从而实现以AI为中枢调度同时关注效率、质量与成本的无人运维。

从当年“三天建一层楼”的“深圳速度”,到今天破旧立新的自贸区探索,都是“一个汗珠摔八瓣”拼出来的。不做光说不练的“假把式”,争当脚踏实地的“实干家”,“撸起袖子加油干”就是成就改革事业的“硬道理”。

消息传输层:通过Kafka实现各功能模块之间的消息交互、调用与服务能力的整合。

词汇黏连造成又一类拼写错误。英语书写规定句子之中的词间需要保持一到两个字母的宽度,可是博物馆里面却有词是连着的。如:“福建金漆木雕纹饰及内涵(Ornamentation of Fujiangold lacquered wood carving and its connotation)”中的Fujiangold是黏连词。Fujian是一个地名,而gold却是另一个词,两者却连在了一起,会让人误以为是一个词。

新建的IT运维平台实现一体化管理,被动向主动转变、应用向业务转变;由被动工具型运维向主动管理型运营转变;从保证应用系统安全、稳定、可靠运行,向支撑业务全生命周期的体验、效率和效益的能力转变。全面提供IT业务运营支撑能力,加强前后端运营支撑的协作,建立灵活的支撑模式。

2.2 系统定位

中国联通总部需建设一套向各级管理单位与合作伙伴提供统一的IT运营与运维服务能力的运营支撑系统。

a)中国联通总部IT运营平台定位。中国联通总部IT运营平台是对运维工作中的计划、组织、实施、控制、升级、改造、需求等工作进行合集管理,为产品生产、运维、服务创造密切相关的各项管理工作提供集中自动化、智能化、运营化的平台。

c)自动巡检:自动化运维模块自动收集服务器的监控数据,对异常数据进行告警,并支持以接口形式将告警发送给ITMS进行派单处理,形成巡检异常的闭环操作。

Probability of Ship Speed Reducing in One-Way Channel

2.3 建设思路

具体建设目标:通过技术运营的手段,推进运营体系向智能化运维转变,实现四化的效果(可视化、标准化、自动化和智能化),最终实现AI调度中枢管理的质量、成本、效率三者兼顾的无人值守运维。

根据IT运维管理的技术发展方向,中国联通新建的IT运维平台应以业务运营支撑需求为驱动,建立规范化的流程支撑体系。近期目标着眼于支撑业务运营并巩固IT运营支撑的核心竞争力,中长期目标集中于积极探索转型IT运营。

2.3.1 运维可视化

新建的IT运营平台以配置管理数据库为核心,以监控管理(基础设施监控、应用监控、日志监控)为手段,通过网络扫描以及机器学习等自动发现技术,将系统抽象、庞杂、海量的数据、IT物理机房、逻辑架构以及业务流程以数据驱动的直观图的形式呈现在人们眼前,实现“数图互换,全栈监控”。

运维人员通过直观图,按图索骥,在架构图中精准定位,检测告警、性能等各类信息,辅助排查故障。通过可视化运维的建设,避免了因IT系统运维人员的离职而造成“信息断层”情况的发生,而且通过直观图,企业的管理层底层、决策层甚至是底层员工都能有效认知企业的IT架构,并随时洞悉最新动态,从而高效地完成各类运维工作,并为运维自动化,智能运维(AIOPS)打下基础。

2.3.2 运维标准化

制定基于IT服务管理(ITSM)的轻量级运维服务流程,再基于该流程建立线上支撑模块,是运维过程中管理意识的落地与标准实现。规范日常运维工作,工作内容可留痕、可评估、可评价。

Q陈老师你好,我儿子4岁8个月,大班。这个学期一个多月了,每天说很多遍不想上幼儿园,想放假,说午睡时间太长等等,还说幼儿园老师说“闭嘴”,这些我们都跟老师交流过。换学校他也不肯,孩子也有些执拗,放假,就会数时间;平时玩的时候,睡着了中间突然醒了会问“我可以玩××吗?”

2.3.3 运维自动化

以IT运营管理场景化为目标,强化企业运维工具以及业务数据的整合。通过搭建场景,在场景中一站式整合各种管理要素,包括IT架构图、运维数据、运维工具、处理规则等,模式化、场景化的整合管理,从而实现IT系统自动化部署、故障预处理、业务连续性保障、系统维护功能,达到高效的运营管理目的。

计划建设或集成的运维工具包括:

2.3.4 运维智能化

“哎,范青青,你不是说要去旅行。你选地方,给你两天时间。”打完电话他就又后悔了,这不就是犯贱吗?但来不及了,范青青连一秒都没有耽搁,回他:“OK!不许反悔,反悔是小狗。”

d)自动化部署:自动化部署用于在操作系统安装完成后的应用软件安装和升级,并根据实际运行状态对IT资源进行缩扩容。

b)中国联通总部IT运营平台与OSS2.0总部系统、省分运维系统关系。中国联通总部IT运营平台作为OSS2.0及省分系统之上的系统,对总部智能监控、沃网络、电子运维、资源管理、客服支撑、统一采集与指令适配等OSS2.0系统及省分系统提供管理手段和运营支撑工具。

b)自动化测试:软件自动化测试是在软件发生变更后,可利用自动化测试工具按照事先制定的测试用例对变更后软件进行测试,可以大大提高软件变更上线的效率,减少测试工作量。

e)批量自动化配置:将日常运维工作中存在的批量配置工作,根据特定运维场景固化为自动化脚本,由自动化运维模块执行,可以大大降低人为操作失误,降低维护复杂度,进而降低运维成本。

f)故障预处理:设备发生故障或告警时,需要能够根据预定义的故障处理规则自动连接故障设备进行预处理,预处理内容包括查询操作和恢复操作。

在建设社会主义法治国家的大环境下,依法治国已是法治社会的发展方向,法律意识深入人心,人人牢记法制观念,时刻准备利用法律武器捍卫自身合法权益,图书馆员为读者提供人性化服务要确保读者合法权益得到尊重与保护,读者享有权益保护的法律法规依据如下:

g)自动作业计划:将具有自动化执行条件的作业计划按照指定规则自动执行,再把执行结果上报给作业计划管理模块进行填报,进而最大程度地提高工作效率,提高运维工作水平。

a)代码管理:代码管理工具具备对源代码全生命周期管理的能力,主要功能包括代码库管理、代码审计、版本审核。

充分利用大数据和AI技术,构建智能化运维管控模型,自动识别业务问题,简化运维操作复杂度,持续改善IT系统健康状况。

主要技术手段包括:

(1)主拖轮“三航拖4007”全权负责半潜驳拖运工作,在拖运过程中负责每小时测定一次船位,并向厦门和福州基地报告;拖航过程中,主拖轮人员应注意观察半潜驳的工作状态,比如航行过程中的吃水情况,缆绳受力状态等,并形成记录;同时时刻关注海上风浪及天气变化,谨慎驾驶,注意避让,确保安全。一般情况决策时,拖轮船长应请示主管领导;在特殊情况下,船长有权采取一切有效指施,以确保人身和船舶的安全,使损失减少到最低限度。

a)基于知识图谱技术建立运维知识库,建立以事件为核心的全闭环运维问题处理模型和评价体系,通过问题事件的关联推荐,把解决方法与经验推送给运维人员,实现快速解决故障的知识支撑。

焚烧炉采用立式底烧,炉底水平切圆布置3台混烧燃烧器,优化炉内温度场,避免炉内局部高温,降低NOx生成。焚烧炉的设计参考“3T+1”原则,保证炉温在1100℃以上,停留时间不小于2s,炉内有足够的扰动,保证可燃物在焚烧炉内完全燃烧。炉体中部设计循环烟气接口,循环烟气与燃烧烟气充分混合,控制出口烟气温度约1100℃,代替过量空气混合控制烟气温度,降低NOx的生成。由于废气、废液压力不同,按每种废气、废液单独配置管路及喷枪,同时考虑废液燃烧器或通道以间歇方式处理有机废液,炉膛维持微负压,设压力、多点式温度监控及联锁系统,炉膛温度具备统计和曲线功能。

b)通过根因分析、关联分析、智能分析,实现对海量监控数据与历史数据的关联分析,利用决策推导和权重分析方法快速定位问题原因。

c)通过异常检测、动态基线、故障预测、指标预测,自动发现时间序列数据中的异常波动,提高复杂IT环境下的检测能力,有效发现故障,实现风险预测。

d)通过告警抑制,统一告警管理,实现告警风暴的有效抑制和告警消息的统一管控,减少大量告警对运维人员的干扰,提高运维工作的效率。

2.4 技术架构

平台技术架构如图2所示。

IT运营平台采用开放式微服务架构,支持无状态事务化处理,能够独立运行且灵活横向扩展,支持当下新技术的应用,具有持续迭代发展的能力,能够不断满足未来发展的需要。

接口服务层:通过丰富的接口支撑实现IT资源的资源数据采集、资源部署、资源开通交付、资源运行保障等完善的生命周期管理。

数据层:支持多元化数据结构,满足海量数据实时消费的场景。

图2 IT运营平台技术架构

第四,解放战争阶段,1946年,中国共产党根据实际需要变“农民减租减息、地主交租交息”的政策为“耕者有其田”的政策;1947年9月13日,又通过《中国土地法大纲》,这就从法律上确认了农民土地所有权,真正得到了人民群众的拥护。

功能层:采用集群式框架,实现单元模块的负载均衡,平台能力可横向扩展支持微服务化。

展现层:前台技术基于轻量级、跨平台、多元化、组件化的设计理念,实现互联网化的站点模式。

2.5 系统框架

中国联通总部IT运营平台为总部一级系统,对总部与省分IT资源进行统一管理,对总部智能监控、沃网络、电子运维、资源管理、客服支撑、统一采集与指令适配等OSS2.0系统及省分系统提供管理手段和运营支撑工具。

IT运营平台集成框架支持各系统间的低耦合部署,配置管理通过对外接口实现IaaS、PaaS、SaaS层配置数据的采集;监控系统和运维自动化根据配置管理的资源数据,实现对设备应用、网络、硬件、日志、动环设备的数据采集、监控、告警、故障处理经验,并具备了日常运维自动化的功能;同时把故障处理经验存储到知识库中进行管理,为运营分析提供应用性能、设备性能、告警数据和业务数据等分析数据。

根据IT运营支撑管理要求和应用性能、设备性能等分析数据为管理部门提供了综合展示的工具,为运维人员提供了统一的门户操作界面。流程管理贯穿IT运营支撑的各个环节,为IT运营工作提供了流程化的管理;安全管理实现了系统的分权分域和用户管理的功能。

运营平台的能力包括:配置信息管理能力、全栈监控能力、标准化轻量级运维流程能力、应用发布管理能力、运维自动化能力、安全管控能力、知识分享与学习能力。

建议建设的模块功能如下。

男性气质研究最早可以追溯到20世纪初的性别角色理论。20世纪后半叶,随着男性气质不断在社会学、人类学领域的拓展,男性气质逐渐成为一门独立学科。其中,R.W.康奈尔是男性气质研究中的巨擘。康奈尔认为男性气质是一种实践的过程,是在实践中所建构的。在她看来,“男性气质”可以被简要定义为“既是在性别关系中的位置,又是男性和女性通过实践确定这种位置的实践活动,以及这些实践活动在身体的经验、个性和文化中产生的影响。”

a)配置管理。配置管理即管理全量资源的可配置项。向整个系统内提供统一的资源数据消费服务,在消费过程中持续改善数据质量。通过完善配置模型形成立体化资源配置管理,实现全面准确的资源信息管理覆盖,支持多种资源数据获取和维护手段,建立资源全生命周期管控流程保证数据的完整性与一致性。

b)监控管理。对网络设备、主机、数据库、中间件、存储、应用、业务、虚拟化等资源信息、告警信息、性能及运行状态的统一监控和管理。

c)流程管理。建设一套完整的运维支撑体系流程,对人员、技术、流程进行高效管理。具备快速适应总部IT运营业务支撑需求的能力,能够从人员、技术和流程3个方面提高IT运营能力,确保高质量地完成IT运营工作。

“艾力素是我们联合美国肥必施公司共同推出的液体缓释氮肥,通过对作物精准补氮,从而保证作物在整个生长过程中供应均衡的营养,实现快速生长。”深圳市艾力农生态发展有限公司董事长助理杨明波表示。

d)自动化运维。构建一个模块化、可全部覆盖各资源类型、支持以可视化方式管理和定义其操作脚本、操作步骤和逻辑,能自动发现故障自动解决的闭环运维自动管理运维平台。具备作业计划、巡检、测试、部署等日常重复性运维工作自动化的能力。

e)安全管理。实现统一的用户管理、认证、授权,日志管理及应用系统接入,提供全流程、全时段、全场景的全生命周期的安全运维支撑。具备统一的安全管理窗口,实现人员和资源的统一管理,访问权限和运维操作安全的权限及认证管理,运维操作的安全审计和可追溯性。

f)知识库管理。专题知识库将传统人工整理总结知识和互联网手段结合,进一步扩充知识库的内涵与外延,提高用户的问题自解决率,降低工单量,减少后台支撑压力,节省平台运维成本。

g)运营分析。引入大数据技术,如IT运维过程中生产的业务数据、日志数据、用户访问与偏好数据,来对IT运营进行全生命周期、多维度的分析,并将分析结果用于应用开发与优化、隐患的整改等方面。IT运维数据集中化,支撑运营分析管理的场景,提供端到端分析的能力。

h)统一门户。统一门户是进入IT运营支撑系统的统一通道,基于界面集成技术,面向不同的角色可自定义定制分析场景,为领导决策、监控运维、运营分析提供不同的工作台视角。

i)综合展示。提供移动展示、大屏展示、Web展示。

3 结论

伴随建立互联网化网络运营支撑体系的发展规划,中国联通适配网络IT化演进,构建开放网络服务体系IT运营平台,整合集中、持续优化,建成行业领先的IT技术支撑体系,支撑运行维护信息共享、高效运营,实现信息化与运营模式的有机融合等行为,有利于支撑企业战略实现。

参考文献:

[1] JANVANBON.IT服务管理:基于ITIL的全球的最佳实践[M].北京:清华大学出版社,2006.

[2] 信息技术服务管理第1部分:服务管理体系要求:ISO/IEC 20000-1[S/OL].[2019-01-17].https://baike.baidu.com/item/ISO20000/4268860?fr=aladdin.

[3] 范田,邵作敬,衣志鹏,等.IT服务管理在运维管理中的分析与应用[J].通讯世界,2018.

[4] 冯万贵.IT运维服务质量改进与IT服务管理体系建设[J].价值工程,2013(23).

[5] 徐建波.IT计算机数据中心智能化运维监控及能效管理的探索与研究[J].电子世界,2018(9):155-157.

[6] 罗砚.基于大数据的信息系统运维智能化研究[J].邮电设计技术,2018(3):79-82.

[7] 郑大永,张明宇,王峰,等.信息系统自动化运维平台的研究与应用[J].中国新通信,2018,v.20(13):123.

[8] 聂磊.基于SaaS架构的IT自动化运维服务系统的实现[D].上海:复旦大学,2010.

[9] 盛红雷,刘洪波,郑磊.基于Docker技术的信息系统自动化运维研究[J].数字通信世界,2018,167(11):97+144.

[10]李春阳,刘迪,崔蔚,等.基于微服务架构的统一应用开发平台[J].计算机系统应用,2017(4):45-50.

[11]陈光年.基于运维服务的专家知识库系统建设探索[C]//2014年MIS/S&A学术交流会议论文集.2014.

[12]IT运维服务管理体系[EB/OL].[2019-01-17].https://wenku.baidu.com.

[13]智能化运维之IT系统统一监控预研报告[EB/OL].[2019-01-17].https://wenku.baidu.com.

[14]智能IT运维[EB/OL].[2019-01-17].https://wenku.baidu.com.

[15]可视化智能IT运维系统[EB/OL].[2019-01-17].https://wenku.baidu.com.

[16]赵志远,章继刚,季莹.智能时代下的IT运维[J].网络安全和信息化,2018,31(11):31-32.

[17]项学明.基于ITIL的电信企业IT运营服务管理模型及应用研究[D].成都:电子科技大学,2009.

[18]陈俊.基于大数据机器学习技术的IT运营分析系统建设[J].计算机时代,2018.

Discussion on the Construction of China Unicom IT Operating Platform

Yang Jieyan1,Li Heng1,Mo Qiong2(1.China Unicom Intelligent Network Center,Beijing 100048,China;2.China Information Technology Designing&Consulting Institute Co.,Ltd.Zhengzhou Branch,Zhengzhou 450007,China)

Abstract: The Internet plus era brings new challenges to traditional operation and maintenance.Operation and maintenance department needs to manage tens of thousands of devices,achieve rapid positioning of equipment failures,maintain massive equipment configuration information,meet the responsible services to achieve rapid service response,reduce manual operation costs,ensure quality of support,and effectively operate related operations and resources,w hich is an urgent problem to be solved for China Unicom IT operation platform.Based on the current situation of China Unicom's operation and maintenance support system construction,it studies and discusses the idea of China Unicom's IToperation platform construction,and studies the platform's functional requirements,technical framew ork and system framew ork from the aspects of system positioning,capability requirements and technical routes,and then puts forw ard the corresponding construction scheme of IToperation platform.

Keywords: IToperation platform;Construction;Capability requirements;Technical roadmap

doi: 10.12045/j.issn.1007-3043.2019.05.017

中图分类号: TN914

文献标识码: A

文章编号: 1007-3043(2019)05-0079-05

收稿日期: 2019-04-01

引用格式: 杨洁艳,李衡,莫穹.中国联通IT运营平台建设思路探讨[J].邮电设计技术,2019(5):79-83.

作者简介:

杨洁艳,毕业于北京邮电大学,工程师,硕士,主要从事中国联通OSS运营工作;李衡,毕业于西安电子科技大学,高级工程师,本科,主要负责中国联通OSS能力建设及整体运营工作;莫穹,毕业于哈尔滨工程大学,本科,主要从事OSSIT系统的咨询设计工作。

标签:;  ;  ;  ;  ;  ;  

中国联通IT运营平台建设思路探讨论文
下载Doc文档

猜你喜欢