(北京天诚同创电气有限公司 北京 100176)
摘要:大数据对电力行业数据中心建设及数据利用提出了更高要求,为了消除严重影响该数据中心安全稳定运行的重大安全隐患,避免局部系统无法实现容错功能,保证所有系统指标均达到T3标准。在总结以往工程建设和运维经验的基础上,本文针对某数据中心分析了关于目前基础设施系统存在的问题和安全隐患,提出了几项共通的问题,在以后的工程设计中彻底避免,以便降低运维风险,增强基础设施运行可靠性和安全性。
关键词:数据中心;空调系统;冷却水管路;冷冻水管路
大数据对电力行业数据中心建设及数据利用提出了更高要求,为了消除严重影响该数据中心安全稳定运行的重大安全隐患,避免局部系统无法实现容错功能,保证所有系统指标均达到T3标准。对某数据中心空调系统进行分析,得出以下问题:
1、检修阀门问题。
问题描述:目前,该数据中心大楼三层、四层空调间的冷冻水水平环状管路设计有缺陷,三层、四层共6个水平环状管路,每个环状管路承担2个空调间的所有精密空调的负荷,空调间环状供回水管设计中相邻空调间以及两个机房间没有检修阀门,是目前基础设施最为致命的缺陷,运维人员无法根据现有条件消除该隐患,需从设计时进行全面考虑。
产生风险如下:
(1)当水平环状管路或者任意1台空调供水回水截门故障,即使是轻微的故障,都将影响2个机房正常制冷,如果解决该故障,则需要停止2个机房精密空调供冷。将直接导致机房设备产生宕机危险。
(2)随着机房负荷的不断增加,停止机房空调供冷进行系统检修,将不具有可行性,除非将机房设备全部停机检修。(2013年7月28日,4-4机房IT负载250kw,占设计负荷50%,4-4空调间1#空调的供水阀门出现漏水现象。在对该阀门实施检修工作时,耗费了20余人力,并通过750公斤干冰进行辅助降温,才勉强维持机房温度在30分钟内由23℃升高到29℃,保障了阀门检修工作的顺利实施。如果出现跑水等类似故障,解决故障的唯一途径只能将机房设备全部停机。)
解决方案:机房空调间空调供回水环路增加必要的检修阀门。示意图如下:
2、冷却水管路设计问题导致加药设备无法在线运行。
问题描述:该数据中心现有400RT螺杆机组2台,850RT离心机组2台。由于当地水质差,硬度大,数据园区制冷系统中,关键节点设备结垢严重。数据中心于2018年3月采购水质在线处理设备,可以自动加药。以满足水质维持在恒定范围之内的要求。由于制冷系统冷却水供回水环路一期设计为3台冷却泵(小)给2台螺杆机组供水,2台冷却泵(大)给2台离心机组供水,冷却泵出水侧没有连通,导致当数据中心使用离心机组时,水处理设备无法形成旁通,只能停用。数据中心目前负荷日趋上升,螺杆机组已无法满足制冷需求,因此,水处理设备平时无法使用,只能转为由人工定期加药。
产生的风险如下:
由于新上设备无法使用,水处理设备形同虚设。此外,人工加药导致人力成本增加,并且加药时效性差,水质监测指标有明显浮动,易形成结垢,结垢现象影响冷却水循环中关键设备的换热效果,若长期存在,对冷机内纯铜管路也有一定腐蚀,并严重影响换热效率和设备寿命。
解决方案:在冷却水回水大泵侧支管,引一条管路到水处理设备,形成供回水旁通。需要对管路进行切焊,加装三通。
3、单路循环的水循环管路,降低容错能力。
问题描述:2台400RT螺杆机组目前没有投入运行,为二期设备预留。并且,两台螺杆制冷机的水循环网路没有完全并入主管道,致使两台螺杆制冷机的水循环网路与主管路之间为单路循环状态。
产生的风险如下:
如若螺杆机在二期中使用,则螺杆机冷却水回路单路运行,目前动力站冷水管路管径较大,并且错综复杂,如果环路出现问题,2台螺杆机组都将停运,达不到容错功能。如果二期设计中不包含螺杆机的使用,将导致2台螺杆机闲置,造成严重的资源浪费,并且占据动力站空间,增加管道的故障点。
解决方案:螺杆机其中一侧的封堵盲板拆掉,将两端出水口均接入主管道。
4、冷冻水管路漏水机房温度升高。
问题描述:由于3-1机房冷冻水供水管出现漏水现象,物业管理人员关闭3-1机房一路冷冻水供水,结果使得3-1服务器机房屋顶温度高于报警设定值25°C,出现报警。
问题分析:
从机房冷冻水管路设计上分析,本数据中心冷冻水管路采用双管制,互为备份。当一路关闭时,另一路能够完全满足机房负荷的要求,其示意图如下:
由示意图可以看出,任何一路出现问题,都不会也不应该影响精密空调的正常供水,更不应该影响机房温度。目前关闭的一路流量较大,现在开启的另一路流量较小。分析主要是由以下几个原因造成:
管道方面
(1)设计时,水力可能不平衡
(2)管道可能某处堵塞
管件方面
(1)阀门可能没有完全开启
(2)阀门处可能堵塞
(3)局部过滤器处可能堵塞
解决方案:
对现在正在运行的管路进行流量及水压压头测定,与正常数值进行对比,具体排查办法如下:
(1)根据系统图,检查所有管路
(2)对压力表进行编号,并检查其读数并记录,进行分析
(3)检查管路阀门是否处在相应的开度
(4)对管路进行流量监测。
结语:在总结以往工程建设和运维经验的基础上,本文针对某数据中心分析了关于目前基础设施系统存在的问题和安全隐患,提出了几项共通的设计问题,在以后的工程设计中彻底避免,以便降低运维风险,增强基础设施运行可靠性和安全性。
参考文献:
[1] GB50174-2017 数据中心设计规范 [S]
[2] GB 50019-2015工业建筑供暖通风与空气调节设计规范 [S]
[3] 陆耀庆. 实用供热空调设计手册. 第二版
作者简介:唐梦辰(1985-),女,满族,籍贯:河北,职称:工程师,学历:本科,研究方向:暖通设计
论文作者:唐梦辰
论文发表刊物:《电力设备》2018年第35期
论文发表时间:2019/5/27
标签:管路论文; 数据中心论文; 螺杆论文; 机房论文; 空调论文; 回水论文; 冷却水论文; 《电力设备》2018年第35期论文;