中通服咨询设计研究院有限公司 江苏 南京 210000
摘要:数据中心经过多年的发展,已经从目前开始宣扬建设可靠性逐步过渡到可用性,系统投资逐步过渡到运维成本优先。同时,很多数据中心用户对数据中心可靠性要求也较高,通常用户愿意为高可靠性付出更多些费用。供电系统是数据中心的最核心系统,其可靠性几乎代表了数据中心可靠性。本文对某案例通过分析,运用基本原理,可使机房项目在基本不增加投资的情况下,供电系统可靠性提升一个数量级。
关键词:数据中心;可靠性;可用性
Abstract:After many years of development, the data center has started to promote the gradual transition from the construction reliability to the availability of system investment,gradually transition to operation and maintenance costs are preferred。 At the same time, a lot of data center users to data center reliability requirements are also high。The user is willing to pay more for high reliability. Power supply system is the core system of data center, and its reliability is almost the reliability of data center. In this paper, through the analysis of a case, the use of the basic principle, can finish the data center project without increasing investment,and power supply system reliability can upgrade an order of magnitude.
Key word:Data:center;reliability;availability
在某项目机房设计中,设计方设计的供电原理图如下:
通过上图可知:
1、本机房定位为C级机房,电源不是双电源。
2、UPS为普通UPS,配置冗余模块或备份UPS。
3、输出配电柜为单个。
4、机柜设备供电采用双电源输入。其本质为单电源冗余双路供电。
从C级机房本身定位及原理图上看,均存在多个单点故障,系统可靠性不高。
可靠性基本模型及原理如下:
可靠性模型图如下图:
1、串联模型
系统中每个设备可靠工作,系统才能可靠工作。
r=r1*r2 (r1<1,r2<1) (1)
在数据中心中,供电系统总体由变压器、断路器、母线、UPS等设备组成,从整体上看是串联模型。
串联模型的意义:
1)系统的可靠性比每个设备低,因此尽可能减少串联设备数量。
2)可靠性由最低可靠性设备决定,因此,尽可能提高最低可靠性的设备的可靠性。
3)由(1)式得到,系统可靠性增加△r=△r1*r2,△r(系统可靠性增加)<△r1(单个设备可靠性增加),因此,一味提高部分设备的可靠性,最终效用是低效的,不需要花大代价选择可靠性特别高的设备。
2、并联模型
系统中至少有1个设备可靠工作,则系统可靠工作。
根据上图,并联数目为2的时候,系统可靠性增加的效率最高。因此,一般并联系统采用为2套并联。
R=1-(1-r1)*(1-r2) (r1<1,r2<1) (2)
对于典型并联系统,r1=r2时,有R=2*r-r2。
并联模型的意义:
1)系统的可靠性比每个设备均高。即使两个线路可靠性相差很大的情况下,系统也比某一部分可靠性要高。
2)在无法改变每个设备的可靠性的前提下,尽量采用并联方式。
3)由式(2)得到系统可靠性增加△R=△r1(1-r2),△R<<△r1,在r2接近1的情况下(数据中心内,设备可靠性较高,可靠性在0.9以上),系统可靠性增加远远小于单个设备可靠性增加,因此不需要花大代价提高单个设备的可靠性,因为,在并联方式下,花大代价提升一个设备可靠性,对整个系统来说影响不大。
4)尽可能减少串联单元数目,并联数目为2的时候,系统可靠性增加的效率最高。
限于本文篇幅,其他模型如表决模型、桥连模型、旁联模型本案例中没有涉及到,本文就不分析了。
一、计算相关数据
系统可靠性要达到4个9,采用并联系统,从(2)式可以得知,每部分只要2个9即可达到系统4个9,下表可知,电气部分设备单个可靠性最少也达到近4个9(变压器),可见达到4个9对于电气部分是比较容易的。
主要供电子系统和部件的故障率和修复率数据
数据中心市电引入可靠性:根据国家电力监管委员会电力可靠性管理中心(http://www.chinaer.org)2012年7月24发布数据。
10KV供电可靠性如下表:
35KV供电可靠性:江苏100%
二、案例分析及结论
在现在建筑中,重要大楼或园区接入为双路供电,可能到某个建筑是单路供电,但园区级别可以有低压或高压母联,可以在一定程度上增加系统可靠性。从上面国家发布的基本数据分析,外电引入引起的数据中心故障比例是很小的。因此在本案例中,在外市电现状下,外市电可靠性是一定的,江苏地区大约在99.95%左右。
考虑到系统是典型的串联系统。因此,只要进线后面系统的可靠性不低于外市电引入的可靠性,整个系统可靠性利用率最高。
从单个设备可靠性99.99%,只要5个设备串联就能将系统可靠性降低到99.95%,但从配电房输出柜到机柜的头柜,串联的设备或环节大于10个,整个降低了一个数量级。
虽然从UPS输出柜到设备机柜是双路供电,但只是线路冗余,不能完全看做是并联线路。
所以,在江苏地区高外市电引入可靠性的情况下,采用单系统供电是降低可靠性的。
因此,考虑提供系统可靠性只有采用并联系统。并联系统的可靠性比任何一部分可靠性都要高。
在基本不增加投资的情况下,只需要一路UPS供电+一路市电供电即可基本达到并联要求。在本案例中,只要将配电柜稍微改动下,即可满足此要求,系统增加开关和配电柜数量不多,投资基本不增加,但可使系统可靠性提升一个数量级。
参考文献
[1]GB50174—2017《数据中心设计规范》.
[2]《数据中心节能供电系统的规划与设计》 王奇英 电子工业出版社
[3]国家电力监管委员会电力可靠性管理中心http://www.chinaer.org)相关数据.
[4]IEEE金皮书(THE IEEE GOLD BOOK STANDARD NETEORK).
[5]《数据中心机房供电系统的可靠性分析 》智慧建筑与城市信息 王奇英 2010年第6期.
论文作者:孙峰
论文发表刊物:《防护工程》2018年第28期
论文发表时间:2019/1/3
标签:可靠性论文; 系统论文; 设备论文; 数据中心论文; 模型论文; 供电系统论文; 机房论文; 《防护工程》2018年第28期论文;