摘要:通过机房动环监控系统的实施,可实现对远程比较分散的无人值守机房的综合监控、集中管理,在无人值守的情况下,也能实时、有效的知道各机房的环境、设备运行状态等情况,并且当前端有突发情况发生时,能做出高效、及时的处理,极大地提高了机房管控水平。本文详细分析了基层电力企业信息机房的动环监控与运维管理。
关键词:电力企业;动环监控;运维管理
电力信息通信网络的逐步扩大,使电力系统的信息机房设备数量、信息运维工作量迅速增加。信息机房是一个集中数据存储、数据传送、数据管理的地方,其安全稳定对电力信息通信网络的运行起着至关重要的作用。对信息机房进行动环监控能让运维人员掌握目前信息机房的设备运行状况、内部动力环境等信息;通过对相关数据进行异常辨识,发现信息机房存在的安全隐患,对做出合理决策具有重要意义。
一、动环监控概述
动环监控即动力环境监控,动环监控系统采用最新组态技术,利用智能设备、网络设备、安防监控及系统的一体基础环境监控管理集成方式,并通过系统软件配合的相应硬件设备对信息机房的各种环境设备、网络设备、数据服务及视频系统实现了全方位的统一监控,以及利用可定制的监控画面,发现异常即自动报警,确保信息系统的可靠运行,从而提高信息系统的可靠性、实时性,进而实现信息机房的科学管理。
二、机房动环监控的必要性
1、UPS监控检测的必要性。UPS监控的作用是用来监视和控制UPS,并在设备呈现毛病、异常时及时告知相关人员。UPS电源可以维护机房防止在不可预知的断电状况下效劳器遭到损害,所以UPS监控必不可少。
2、配电监控检测的必要性。需求实时监测市电总输出:三相电压、三相电流等,缺相、过压、高压告警。实时监控各配电柜的输入:各负载开关的状态、重要负载电流。
3、温湿度监控检测的必要性。由于机房设备比较多,温湿渡过高容易腐蚀或烧坏电子元件,温湿渡过低则发生静电,这两种状况都会影响机房环境,从而招致机房遭受损失,所以需求温湿度检测以便将温度和湿度控制在一定范围内。
4、空调监控检测的必要性。机房空调是为保证机房内所运转设备的平安运转而提供临时不连续的恒温、恒湿、干净的空调环境设备。
5、漏水监控检测的必要性。机房漏水的隐患临时存在,不能及时发现,造成后果很严重,所以需求实时监控检测机房内的漏水现象。
6、消防烟雾监控检测的必要性。引起机房内发生火灾的因素很多,例如电线老化短路等。消防烟雾器起到了一定的作用线,联动任何类型的检测或抑制设备,为防火提供了更多的防损伤维护。
三、信息机房动环监控
1、系统框架结构。电力企业信息机房的稳定运行包括信息设备硬件和设施环境的支撑。其中动环监控涵盖环境系统、动力系统及消防监控系统等内容。通过采集卡所设置的相同传输端口,依靠以太网模式的传感设备接入到交换机,支持串口模式的传感设备接入到串口控制模块,统一接入监控终端主机并设置Web端服务功能,方便运维人员进行实时查询机房设备、设施运转状态;同时,出现的告警信息将以特定提示音、平台短信形式发送至相关维护人员。
2、动力监控系统。动力监控系统针对信息机房的配电柜、UPS和通信电源等运行情况进行实时监控,监测设备的相关可靠数据,包括电压、无功功率、频率等;实时监测UPS整流器、输入输出负载、电池和旁路的运行状态,方便运维人员及时发现故障,确保信息机房电源持续稳定性。
3、环境监控系统。环境监控系统是通过对信息机房内的新风机、精密空调和温湿度测量仪等设备产生的实时数据进行监控,有效调节机房的整体运行环境。
期刊文章分类查询,尽在期刊图书馆精密空调的用处包括以下方面:①平衡信息机房内温度与湿度;②检测空调加湿器和风机等重要部件的运转情况;③建立有效的滤网清洗制度,对通过新风机部件的运转状态进行实时监控和调节外部环境与机房间的正压差;④降低噪音并控制在65dB(A)以内,确保信息机房内运维人员身体健康;在此基础上同步控制机房内的温湿度差异,确保不会出现机房温度过高造成设备运行卡顿、重启和死机,不会温度过低造成空调设备能耗加大,亦不会湿度较高或较低金属类设备仪器加速腐蚀或产生静电造成损坏。
4、安防系统。安防系统分为两部分,一方面为门禁系统,门禁系统技术发展十分迅速,现如今人脸识别门禁系统逐步取代以往的感应卡式门禁系统,对信息机房进出人员的管理更加准确化、细致化,禁止无关人员随意进入信息机房,仅允许被授权的运维人员和相关管理员进出信息机房,并自动记录保存每次进出人员的人脸识别记录;另一方面是网络摄像监控系统,该系统支持基于Web的实时查询模式,方便主站运维人员监控机房内的人员分布和活动情况,
5、消防监控系统。消防监控系统包含自动化设置和手动器械,前者通过烟感与温感等设备对火灾发生做出实时警报,并启用七氟丙烷自动灭火装置对火灾现场做出应急灭火措施;后者在机房内外的合理位置放置消防栓及手持式灭火器;以确保火灾发生时对灾情进行控制。
四、信息机房的运维管理
1、日常运维管理。机房日常运维管理主要是对信息机房设备的日常运维、人员、出入机房制度进行科学合理的管理。有效的降低信息机房内各类故障发生率,延长相关设备的运行使用年限、提升故障运维效率。
1)日志记录
①信息机房内运行中设备的系统日志记录相关设备日常运行状况、关键参数,由通过相应的运行中系统自动生成。
②信息机房日常巡检日志由机房管理员对信息机房日常巡检状况,包括温湿度变化、UPS负载状态调整、备用电池容量性能、消防设施检测。
③信息机房日常出入日志账本记录所有进出人员关于出入时间、事由、操作记录(如设备安装调试)等详实记录,由机房管理员与进出人员进行确认签字,并结合人脸识别门禁系统对信息的正确性和有效性进行双重保证。
④机房故障运维日志记录设备故障的情况说明、运维处理方法、由运维人员和机房管理员记录。
2)人员管理包括运维人员定期的专业技术培训、安全意识教育。运维人员具备较强的操作能力,熟练掌握查杀病毒,升级操作系统补丁,能使用相关软件针对操作系统进行漏洞扫描和后续处理,定期更换具有高强度的复杂口令,不使用来历不明的传输存储介质,禁止下载、上传业务无关数据。
2、应急保障措施。信息机房可能会遭遇到各类突发性安全事故,因此需要制定针对突发性事故的应急预案,并定期对运维人员进行实际培训及演练,确保运维人员在遇到突发性事故时能做到临危不乱、有条不紊的保护和抢修设备,尽量降低因突发性安全事故而造成的损失。以设备系统停止运行的突然状况为例,首先及时局部断电处理,检查该设备停运原因,同时报告上级。如是设备超过最高允许工作温度造成停运的按照预案进行设备抢修,若能简易修复的则在修复后重启上线;若是无法在现场进行快速简单修复的设备,及时联系该设备生产厂家,进行返厂修理或派遣技术人员处理,同时将该设备承载的业务跳转连接到备用设备上运行,避免出现长时间业务停运导致其他关联业务的瘫痪。
五、结语
总之,为保证基层电力企业机房设备的良好运行状态和使用寿命及安全,必须对其运行环境的电力供应、温度、湿度等诸多环境变量,UPS、空调、新风、除湿等诸多设备运行状态变量,24小时实时监测与智能化调节控制,以保证机房设备运行环境的稳定与软硬件资源、设备的安全及相关信息数据资产的安全。
参考文献:
[1]张程.关于电力信息机房智能综合监控的研究[J].通讯世界,2013(20).
[2]夏冠卿.现代信息化机房建设探析[J].工程技术,2015(17).
[3]孙健琦.基层电力企业信息机房动环监控与运维管理[J].电子技术与软件工程,2019(03).
论文作者:白永庆
论文发表刊物:《电力设备》2019年第3期
论文发表时间:2019/6/5
标签:机房论文; 设备论文; 信息论文; 人员论文; 监控系统论文; 实时论文; 必要性论文; 《电力设备》2019年第3期论文;