超融合私有云技术在电厂的研究应用论文_丁轶

(大唐陕西发电有限公司灞桥热电厂 陕西省西安市 710038)

摘要:随着企业信息化建设的推进,不断有新的信息系统上线,对服务器的需求不断增加,传统的单服务器或多服务器对应单系统的部署方式存在如单点故障的风险,维护工作量增加,机房供电和制冷的需求增加,机房耗电增加,量占用机房空间等问题。现在国家大力倡导使用云技术,云技术具有安全可靠、充分利用资源、节约成本等优点,电厂作为国家重要的基础实施不可以使用公有云,可以利用超融合技术搭建私有云平台,利用先进的云技术解决服务器增加带来的问题。

关键词:超融合;私有云;云技术

一、简介

大唐陕西发电有限公司灞桥热电厂(以下简称我厂)位于陕西省西安市东郊,是国家“一五”时期重点工程之一,目前火电总装机容量850MW。

随着工业信息化水平的提高,电厂不断有新的信息系统上线,对服务器的需求不断增加,采用传统的服务器部署方式,每增加个信息系统要增加1-4台服务器,采购成本高,施工复杂,占用机房空间,耗电大,单点故障风险高。我厂目前在用的信息系统有18个,使用传统服务器部署方式至少需要30台服务器,使用超融合私有云技术可以只使用少量服务器就可以替代原来30台服务器才能完成的工作,而且占用空间少,能耗低,没有单点故障风险。

二、实施背景

我厂机房采用传统服务器部署方式存主要存在以下问题:

1)存在单点故障风险:传统服务器部署方式,一台服务器承载一个信息系统或一个数据库,一旦服务器硬件出现故障,必然导致所承载的系统无法正常使用,影响系统的稳定运行。

2)维护复杂效率低:传统系统部署方式都依托在服务器硬件的基础上,在日常厂工作中经常需要进行安装操作系统,安装信息系统,迁移数据,备份和恢复数据,搭建测试环境等工作,不但耗费时间长,工作量巨大,而且在数据迁移和恢复总容易造成数据丢失和损坏,给维护人员工作带来了很多的挑战。而且众多服务器需要分别登录进行维护,分散管理也增加了维护的工作量。

3)无法提升运算能力:随着系统系统的升级,对服务器计算能力需求不断提升,但是传统服务器无法升级CPU,要满足信息系统的需要必须更换服务器。

4)占用空间,能耗巨大:传统服务器部署方式需要部署大量服务器以承载不同的信息系统,大量占用机房空间的同时也增加了机房用电量和发热量,对于较小的机房就需要进行机房扩建,对于UPS供电和制冷不足的机房需要进行UPS供电系统和制冷系统的改造,成本巨大。

三、成果原理

超融合技术介绍,超融合是指运用信息技术将分散在多台硬件服务器中的硬件资源进行横向整合,包括CPU资源、内存资源、存储资源。整合的资源形成资源池,方便云技术对资源再次分配使用。

私有云技术介绍,私有云技术是在多台服务器资源超融合的基础上,可根据业务需要从资源池中随机抽取资源组成虚拟服务器,任何一台物理服务器的单机故障只会减少资源池中的资源数量,只要资源池中的资源总量能够满足所有虚拟服务器的使用需求,就不会影响任何一台虚拟服务器正常运行,极大的提高了业务系统的稳定性。

超融合私有云可以解决的问题:

1)使用云技术避免单点故障:虚拟服务器利用资源池中的资源组件,任何一台物理服务器的单机故障只会减少资源池中的资源数量,只要资源池中的资源能够满足所有虚拟服务器的使用需求,就不会影响任何一台虚拟服务器正常运行,运行的虚拟服务器会自动从其他正常工作的服务器中获取资源,并漂移至其他正常工作的物理服务器上,保证业务系统的稳定运行。

2)云平台管理功能强大,简化维护难度,降低工作量:超融合云平台可以在一个平台上对所有的虚拟机进行创建,删除,复制,备份,迁移,恢复等工作,所有操作在平在中完成,效率高速度快,无数据丢失和损坏风险,比部署物理服务器大大的节约了工作量,提高了工作效率。

3)动态分配计算资源:当虚拟服务器资源不能满足信息系统需求时,可以给它动态的分配资源,扩大CPU、内存、存储的资源量,不需要更换服务器。云平台还具备资源动态分配的技术,业务系统对CPU资源和内存资源的使用存在高峰期和低谷期,当低谷期平台会自动释放部分资源以节约能耗,当高峰期平台会自动分配足够的资源已处理高峰时的计算量,动态的资源分配,可以更好的进行资源的合理利用。

4)占用空间少,降低能耗:仅用少量高性能服务器部署的云平台就可以满足大量物理服务器才能完成的工作,极大的减少服务器占用的机房空间,也减少了服务器的发热量和用电量。对于较小的机房可以不用进行机房扩建,对于UPS供电和制冷不足的机房也可以不用再进行改造。

四、实际应用情况

我厂超融合私有云的应用情况:

1)超融合部署架构:

我厂采购了三台服务器,服务器性能(24核X2 Intel(R)Xeon(R)CPU E5-2650 v4 @2.20GHz,128G,闪存40G,硬盘8*500G),两台万兆交换机,一台USBsever设备,链接方式如下图。

每台服务器需要链接7根线,其中一根管理网线线直接连接核心交换机,用于云平台的管理;两个万兆光口用多模尾纤分别与两台万兆交换机连接,用于云平台内的数据交换,由于云平台上要同时运行多个系统,传输的数据量巨大,所以必须使用万兆设备进行信息传递,使用两台交换机是为了相互冗余,防止单点故障导致所有系统奔溃;有两根业务网线直接链接核心交换机,用于虚拟平台与物理网络之间的数据交换,由于数据交换量大,两根网线做了聚合;最后两根Vxlan线直接链接核心交换机,用于虚拟机之间进行数据交换,一般是分布式防火墙,虚拟交换机,虚拟路由器之间的信息交换,两根网线也做了聚合。

由于有的信息系统需要有软件狗的配合才可以使用,由于虚拟服务器没有真实的USB口,物理服务器上的USB借口虽然可以分配给虚拟机使用,但是当服务器故障时,USB借口无法使用,将导致虽然系统正常迁移,但是由于没有软件狗授权,系统依然无法使用。所以需要一个所有虚拟机共享的USB接口,因此配备一个USBSever,USBsever直接与核心交换机链接,系统软件狗插在USBSever上就可以满足共享狗的功能。

最后,云平台还提供了对物理服务器的查看功能,可以直接查看实体机的运行状态,资源使用情况等信息。

实体机管理界面

3)云平台资源利用分析

我厂的超融合私有云平台可以分配出低性能服务器(3核CPU,8G内存,300G硬盘)44个,中等性能服务器(6核CPU,16G内存,600G硬盘)22个,高性能服务器(8核CPU,42G内存,1T硬盘)9个,基本满足我厂信息系统部署的需要。

以上可创建的服务器数量是在不考虑系统冗余情况下,将资源最大化利用到极限的状态。为保证在任意一台服务器故障的情况下,另外两台服务器可以承接所有业务系统,满足云平台的高稳定性,在分配云平台的资源时必须留出1/n的资源作为备用(n为云平台物理服务器的数量)。若保留的资源不足1/n,当一台服务器故障导致1/n资源退出云平台时,剩余的资源无法承接所有业务,会有部分业务系统无法使用。通过增加硬件服务器的方法可以有效增加可分配资源量。

增加服务器还可以提高系统稳定性,例如将服务器增加至5台,当分配资源不超过总资源的4/5时,可满足一台服务器故障退出时所有业务不受影响,当使用资源不超过总资源的3/5时,可满足两台服务器同时故障退出时所有业务不受影响。

五、推广价值及范围

所有需要在内网自建信息系统的企业都可以搭建超融合私有云平台,私有云平台可以提高信息系统运行可靠性,减少对硬件和基础设施投入。云平台统一管理方便维护,极大的提高了信息系统的运维效率,节约人力成本和时间成本。云平台还可以通过扩展服务器提升平台的容量和稳定性。企业可根据自身的需求,从业务出发,合理的搭建自己的超融合私有云平台。

论文作者:丁轶

论文发表刊物:《电力设备》2019年第10期

论文发表时间:2019/10/18

标签:;  ;  ;  ;  ;  ;  ;  ;  

超融合私有云技术在电厂的研究应用论文_丁轶
下载Doc文档

猜你喜欢