摘要:设备联网的架构,是在物联网的基础下,被提出与应用。简单来说,设备联网定义为:各种设备之间可通过各种通讯手段连上因特网,使其能在某一特定情境下,进行互相联结,进而达到自动化、智能化监控的目的。
关键词:设备 群控
引言:
在制造工业环境中,生产、制造、加工、半导体等行业为了了解设备机台的运行状态,均会采用三色灯、蜂鸣器做为机台状态的指示,一旦机台发生状况或者警报,现场人员得以藉由灯号状态了解设备状态,进而追踪或者维修。但工厂为了因应产量的需求,机台产线不断地扩张,机群不断的增加,现场人力需求随之提高,且现场人员因需奔波厂区,效率随着产线的扩张而降低。渐渐的,人力监管已逐渐无法满足用户的需求,制造业者希望能采用自动化的方式,由数字监控的方式采集设备数据,并具有集中管理的功能。因此设备机台状态采集,早已由现场人员的监看演变为工厂自动化的领域,利用自动化的采集手段提供设备联网的功能,进行所有生产机台的状态监控。
1.背景
设备联网的架构是在物联网的基础下,被提出与应用。简单来说,设备联网定义为:各种设备之间可通过各种通讯手段连上因特网,使其能在某一特定情境下,进行互相联结,进而达到自动化、智能化监控的目的。机群系统因为其高性价比。良好的硬件可扩展性,无论是在高性能科学计算领域,还是在商务计算领域,都得到了广泛的应用。然而随着应用的复杂化和大型化机群系统硬件规模,节点数量直线上升。为了有效地使用这些节点资源,必须及时准确地了解机群中所有资源的当前状态和使用状况,同时随着节点数量的直线上升,机群系统的维护和管理问题也就越来越凸现出来,如何快速发现和定位出故障的主机节点,以及如何高效地利用机群中这些的宝贵资源,为用户提供一个安全、可管理、高可用、易维护的机群系统是一个值得研究的课题,为了更有效地管理硬件资源,使其能为上层应用提供一个高可用的支持。我们实现了一个基于机群中间件的监控系统clusterview该系统能够及时准确地为系统管理员报告节点的状态信息和机群中网络的状态,同时能够使系统管理员及时了解到机群中所有节点的当前资源使用情况,为任务分配和作业调度提供可靠的依据。基于此,本文对此系统进行了详细分析。
2.体系结构和实现
监控系统clusterview的总体结构如图1所示。在图中只画出了3个公告版形成的联邦,在实际中可以根据机群规模的,大小将所有的节点分成几个物理分区而定"每个物理分区最少可以只有4个节点,最多可以包含256个节点,根据运行数据公告服务节点的性能和机群中节点数目综合考虑而定分成几个物理分区" 若数据公告的数目过少,甚至整个监控系统只有一个数据公告服务在运行,则数据公告服务相当于一个节点资源状态收集器,此数据公告服务成立一个瓶颈,存在单一失效点,也不利于机群的扩展。若太多则建成联邦又过于复杂,不利于数据公告中数据的检索和查询。
图1监控系统的体系结构
2.1数据公告服务
在监控系统的中间层次是形成联邦的数据公告服务detector通过多波获取系统中运行的所有数据公告服务的物理位置,根据每个数据公告的响应时间或在每个数据公告服务中已经连接的个数决定自己与那一个数据公告建立连接,可以选择响应时间最短或已建立连接数最少的数据公告作为本节点detector提交数据的数据公告,若某个数据公告出现故障,已经与之建立连接的detector则会自动重新再与其它的数据公告建立起新的连接,向新建立连接的数据公告提交数据,保证了整个监控系统高可用性,能够为上层应用提供及时可靠的监控数据。同时,因为多个数据公告服务在机群中间件中形成联邦,从任何一个数据公告都可获取所有节点的相关数据,则连接在任何一个数据公告的应用都能够自动获取整个机群中所有节点的监控信息,在保证了高可用的同时也保证了对外服务的透明性。
2.2机群监控系统的可视化
由数据公告提供的作为一个单一机群映像的各个节点的监测数据,即可以是根据监控数据的性能分析和预测应用也可以是作业调度程序,同时我们将监测信息进行可视化,以实时将各个节点的资源使用情况以直观的方式显示出来。供系统管理员实时了解机群的当前资源使用状况,以作为进行作业调度和加载的一个参考依据。同时为了能够对机群资源的历史使用情况进行查询,进行分析。我们将从数据公告中获取的监控数据定期地保存到数据库中,我们采用的CFGIJ数据库,它是一个开放源码的简单高效、易用的数据库,用它存储的历史数据和当前数据可以根据用户的选择条件供视图显示。
2.3低层监控守护进程
在机群中每一节点的监控数据是由运行在每个节点的detector采集得到的.detector守护进程是是多个线程组成的集合体,主要功能由如下资源监视器和应用监视器两个线程组成,资源监视器和应用监视器都是以构件的形式存在的。提供的是一个可灵活配置的,各个模块是可以根据需要动态加载卸载的侦测服务,它可以对机器的硬件资源进行监测,同时也可以对节点上运行的应用进行监测。
结语
论文提出了一种基于机群中间件的监控系统的实现方式,利用机群中间件中的数据公告服务为集群系统中的监测数据产生者提供了一个位置透明的分布式数据存储服务,为数据需求者提供了一个访问数据的统一接口,并针对集群系统的特点,服务还提供了一定的高可用机制。同时利用机群中间件数据公告服务能够对加入或退出节点的自动发现,有利于系统的可扩展性和可伸缩性的实现。
参考文献:
[1]詹宏宏,贾民平,胡建中,苏中元.机群状态远程监测与故障诊断系统的研制[J].东南大学学报(自然科学版),2005(05):52-55.
[2]刘芳,赵建印,宋贵宝.任务准备阶段机群战备完好率评估模型[J].哈尔滨工业大学学报,2008(03):488-491.
[3]谭东东,鲁冬林,张绍铜,王录雁.工程机械机群状态监测系统研究[J].建筑机械化,2009,30(04):45-47.
[4]赵春华,陈鹏,朱大林,于志强.无线传感网络在机群状态监测中的应用研究[J].计算机与数字工程,2007(04):82-84+90+4.
论文作者:杜凤鹏
论文发表刊物:《基层建设》2019年第6期
论文发表时间:2019/4/19
标签:机群论文; 数据论文; 节点论文; 公告论文; 状态论文; 设备论文; 机台论文; 《基层建设》2019年第6期论文;