网格环境下资源监控系统的研究与实现

网格环境下资源监控系统的研究与实现

王志瑞[1]2007年在《网格环境下资源监控的研究及应用》文中研究表明为了监控网格环境下分布的、动态的、异构的资源,本文分析了网格环境下资源监控的任务、难点和用途,并对GMA网格资源监控框架,以及不同部件之间的交互方式进行了研究。在分析了几个典型的网格资源监控系统特性的基础上,研究了网格架构的可扩展性,异构和动态资源的监控,并根据网格资源监控系统设计原则和功能需求,设计了一种可扩展的网格资源监控系统GridRMS。本文主要工作如下:(1)研究了网格资源监控框架GMA,详细分析了网格资源监控系统的基本模型和功能框架,以及不同部件之间的交互方式。研究了以GMA为基础实现的网格资源监控系统,分析了各系统的基本设计框架和思想,以及具有的优缺点。(2)根据网格监控系统的特殊需求,研究了监控系统架构的可扩展性,以及异构和动态资源的监控等问题。根据网格环境的特点设计了一种可扩展的两层监控架构,能够用于子网格或大网格的资源监控。根据网格资源的特点,设计了一种层次化的资源描述模型,以及采用了一种跨平台的资源描述语言和动态刷新的目录服务技术,来解决监控资源的异构性和动态性问题。(3)根据监控系统的设计原则和功能需求,设计了一种可扩展的网格资源监控系统GridRMS。该系统基于GMA框架,采用两层的架构设计,系统中所有的资源信息采用层次化资源模型描述。重点设计了其中的资源代理和目录服务模块。监控服务采用标准的Web Service描述,利于模块之间的相互调用和协作,降低模块之间的耦合度,提高系统可管理性。(4)最后对GridRMS的关键模块进行了实验性实现,并通过在GridRMS中加入一个集群探测器和消费者验证了GridRMS的可用性。

田鸣华[2]2004年在《网格环境下资源监控系统的研究与实现》文中指出网格是集成了Internet上大量分布异构资源的复杂系统,网格计算的目标是实现广域网范围内异构资源的共享和协同工作。在网格环境中,对资源状态、网络连接状态、应用程序运行状态的监控与分析,对于提高网格应用的性能至关重要。网格资源监控系统通过分析监控数据,掌握网格资源的利用情况和状态,可以及时发现故障,找出系统性能瓶颈,为网格资源调度及性能优化提供依据。因此,对网格资源监控系统的研究具有重要的学术意义和应用价值。 本文深入分析了网格资源监控系统的需求,研究了全球网格论坛提出的网格资源监控体系结构(Grid monitoring architecture,GMA),分析比较了几个基于GMA实现的网格资源监控系统,重点研究了网格环境下资源信息模型,资源信息的组织与管理,资源信息的实时监测与更新,资源信息的分布存储,资源信息有效期与优化以及资源监控服务的可扩展性等关键技术。 基于以上的分析和研究,本文自主设计并实现了面向服务的网格资源监控系统GridEye。该系统基于GMA体系结构,采用分布式结构设计,能对分布在广域范围内各种异构的资源提供系统、网络和应用层次的资源监测与控制,并为上层应用提供资源监控信息。系统设计逻辑上分为局部监控和全局监控两个层次。局部监控负责一个结点或区域的资源监控和资源详细信息的存储;全局监控负责对各局部监控的监控和管理,以及资源统计信息的存储。系统采用面向服务和模块化方法实现,具有灵活的可配置性、可管理性、可扩展性和高可用性。本文还对GridEye中的安全服务访问、资源信息归档优化、底层监控资源的接入和撤销作了深入的研究和具体实现。该系统已在中国国家网格系统软件中部署和试运行,用于监控网格环境中的多种资源,并为基于网格的上层应用提供灵活有效的资源信息访问支持。

李江卫[3]2007年在《校园计算网格监控系统研究与实现》文中研究指明网格资源具有分布性、异构性、动态性和自治性等特点,这使得网格的应用和推广面临很多挑战。作为网格基础组件之一的资源监控系统为网格上层应用提供重要的数据支持,因此对网格监控系统进行深入研究具有重要的理论与应用价值。 本文通过对计算网格环境下所采用的相关监控技术进行深入分析和研究,指出目前网格监控中存在的问题。本着“实用为主,应用领先”的设计原则,我们设计并实现了一个内容丰富并且易于扩展的网格监控系统,并对基于监控系统的应用进行了初步研究,提出一种面向应用的校园计算网格作业调度算法。 具体研究内容如下: 1.通过分析和研究当今颇具代表性和影响力的几种基于GMA模型的网格监控体系结构,根据我校计算网格系统的实际需求,设计了一种通用自动化网格监控体系结构,研究内容包括资源信息采集方法、自动化数据收集服务和资源信息查询服务等。 2.将系统在我校计算网格之上进行部署。目前提供的监控服务主要有:主机类信息监控服务、作业类信息监控服务、应用类信息监控服务和用户类信息监控服务等。 3.对网格监控所得数据进行初步分析和应用。通过分析网格监控服务提供的数据,提出一种资源评估模型,并推导出作业适宜分配度算法。把算法应用于作业调度系统,指导校园计算网格作业的调度,实验证明这种方法是行之有效的。 本文研究的网格监控系统已在我校计算网格项目中得到应用,并取得了令人满意的效果。同时,作为网格系统基础组件之一的网格监控系统的建立,为下一步工作奠定了基础,包括:网格故障处理和错误检测、网格性能分析与调整、调度决策系统和审计与入侵检测系统,这些项目都可以根据监控系统提供的数据进行研究和论证。

彭武杰[4]2010年在《基于Ganglia和MDS的校园计算网格监控研究》文中指出网格环境中的资源是分布的、异构的、数量庞大而且随机变化的,网格节点可能随时加入和离开网格环境,这些特性会导致资源和任务运行信息的频繁采集,大量消耗节点资源,也容易导致网格任务调度时被分配给无效的节点,严重影响网格任务调度的执行效率。所以构建一个灵活高效的网格资源监控系统,监控节点资源和在其上运行的网格任务的资源消耗信息,是网格计算中重要的环节。校园计算网格是利用校园网内的计算资源构建的计算网格,为校园环境内的各种研究工作提供高性能的计算能力。校园计算网格(UCGrid 3.0)的核心技术是基于GT4开发的计算网格分布式中间件,并以此为基础建立了校园计算网格门户,提供了校园计算网格运行的各种功能。校园计算网格可以解决校园内很多资源没有充分利用而同时有很多任务得不到相应资源的问题。建设校园计算网格的关键技术之一是解决资源监测问题。资源监测为校园计算网格提供必要的与资源有关的性能数据,是资源发现和资源分配的基础。本文以校园计算网格平台UCGrid3.0为监控对象,设计并开发了校园计算网格监控系统,包括校园计算网格监测门户和校园计算网格监控器。以往的研究仅限于资源监测方面,本文研究的监控系统包含监测和控制两个方面,提出了对校园计算网格全面的监控方案。校园计算网格监测门户是对校园计算网格中的各种资源的实时监测平台,提供了对CPU、内存、硬盘、网络流量等各种静态和动态的资源信息的实时监测并通过图形化方式展现。为了弥补GT中MDS组件对资源信息监测的全面性和实时性方面的不足,校园计算网格监测门户引入了Ganglia监控框架,基于Ganglia二次开发。监测门户通过与gmond组件进行通信,将gmond收集的网格资源实时信息通过web页面的方式展现,同时将实时资源信息写入到MDS和数据库中。校园计算网格监控器CGAMS可以监控校园计算网格中间件、GT网格环境、网格数据库等,为校园计算网格的持续正常运行提供保障。CGAMS分为中心控制端和信息反馈端,分别部署在校园计算网格的中心节点和各分节点上,两端之间通过基于Socket的异步通信机制进行通信。其中中心控制端提供对中心节点上的校园计算网格中间件和GT组件的监控,并接收信息反馈端发送过来的GT组件运行的状态信息,同时中心控制端还可以恢复分节点的GT组件重新正常工作。CGAMS采用多线程技术开发,确保了在同一时间可以并发完成各种不同的功能。由校园计算网格监测门户和网格监控器组成的校园计算网格监控系统,不仅可以实时地监测网格环境中的各种资源信息,同时还可以控制与校园计算网格相关的各种组件,为校园计算网格提供了一个集监测和控制于一体的全面资源监控解决方案。校园计算网格监测门户和网格监控器CGAMS分别在已有的校园计算网格环境中进行了部署。在运行过程中该监控系统取得了良好的效果,不仅为网格资源的调度提供全面的数据支持,同时也可保障校园计算网格的持续正常工作。

梁毅[5]2005年在《面向网络计算的作业调度系统关键技术研究》文中认为在网络计算环境中,作业调度系统将网络计算环境中分布的资源整合起来,合理调度作业,充分利用网络中的资源,提高系统的利用率。因此成为网络计算环境的核心和灵魂。机群和网格作为网络计算环境的两个里程碑,成为了目前研究的热点。机群以其卓越的性能价格比和良好的扩展性成为了当今高性能计算的主流体系结构。目前,机群的发展呈现出支持的应用类型以及用户管理需求多样性的特征。而网格作为新兴的网络计算环境,它与机群系统最大的差别在于它是一个缺少中央控制、没有全知者以及强的信任关系的计算环境。网格平台的构建有赖于用户自愿提供资源,实现资源的共享和交换,减少资源冗余,从而形成了一个非合作式的网络计算环境。本文以网络计算环境的变化---从机群到网格为线索,对网络计算环境下作业调度的关键技术进行了总结和探讨。重点研究了(1)机群单管理分区环境下,作业调度策略问题;(2)机群多管理分区环境中,作业调度存在的资源视图割裂问题;(3)网格非合作式环境下,用户作业信息不完全导致传统作业调度策略失效问题。本文取得的具体研究成果如下:1.针对机群单管理分区环境下,作业调度策略难以兼顾作业执行效率和公平性问题,本文第叁章提出了一种结合Firstfit及预约回填策略的作业调度算法RB-FIFT。RB-FIFT调度策略通过预约策略解决了作业饥饿问题,实现作业调度的公平性;并通过firstfit和回填策略减少了作业执行中产生的资源碎片,从而提高了作业的执行效率。性能测试结果表明,与传统的先来先服务(FCFS)算法和Firstfit算法比较,(1)在精确估计作业运行时间的情况下,RB-FIFT算法在多项性能指标上有明显提高,其中作业最大响应时间的减小幅度最大为19.5%,平均等待时间最大减小幅度为54.9%,;(2) RB-FIFT算法的性能并不随着作业运行时间估计不精确性的增加而单调的增大或减小,与精确估计运行时间情况比较,其中作业平均等待时间最大减小幅度为30%。2.针对机群多管理分区环境下,资源分区导致资源视图割裂问题,本文第四章提出了基于动态租借原理的机群作业调度思想,阐述了实现该思想的关键技术,并给出了一个基于动态租借原理的机群作业调度系统DRJSS。性能试验结果证明,与既有的固定分区和动态作业推送解决方案比较,动态租借策略具有较好的性能优越性,其中作业平均等待时间最多下降了1.32倍。在资源频繁租借、回收的情况下,由于作业迁移开销仅为毫秒(ms)级,动态租借策略仍具有较好的优越性。3.针对网格非合作环境下,用户作业信息不完全导致传统作业调度策略失效问题,本文第五、六章引入微观经济学的机制设计理论,针对同构和异构环境,分别提出了基于同构资源聚合拍卖的作业调度算法HoRAA和基于异构资源聚合拍卖的作业调度算法HtRAA。HoRAA算法借鉴双边拍卖的思想,实现了促使资源买卖双方真实反映资

单今乐[6]2005年在《网格资源监控技术的研究与实现》文中认为随着Internet技术的飞速发展和广泛应用,一种新的计算模式——网格计算——蓬勃发展起来。作为一种新兴技术,网格计算自然面临着许多急需解决的挑战性问题。问题之一就是:在网格资源、网格系统软件和网格用户行为都具有高度、频繁的动态变化特性的情况下,如何实时、准确地获得网格的整体信息和特定区域的局部信息,以达到及时发现故障,维护负载平衡的目的。这一问题的解决可以为网格资源调度及性能优化等提供数据依据,最终提高网格应用的性能。因此,对网格资源监控技术的研究具有重要的学术意义和应用价值。 本文说明了网格资源监控的特点,论证了网格资源监控的必要性,并分析了网格资源监控的关键技术。本文还自主设计并实现了面向服务的网格资源监控系统GridEye,以向用户、管理者和应用提供实时的、统计的网格资源信息状况。该系统基于GMA体系结构,采用分布式结构设计,能对分布在广域范围内各种异构的资源提供系统、网络和应用叁个层次的资源监测与控制,并为上层应用提供资源监控信息支持。该系统经过了严格的功能和性能测试,也已在CNGrid(中国国家网格)环境中部署和运行。

宋智礼[7]2004年在《应用网络技术实现校园网的资源监控系统》文中研究表明随着计算机性能不断提高,现实当中很多计算机资源没得到充分利用,大部分时间处于闲置或接近闲置状态,而且网络内的资源分属不同的组织和个人,每个使用者都有自己的特点,这就必然会造成某些时间段内,一些人因计算任务大使资源过载,而另一些人因为任务少,使一些资源闲置。这便是所谓的“资源饥饿”问题。如何改善这一状况,提高资源利用率成为我们所要解决的一个现实问题。网格作为一种将地理上分布的,异构的计算及存储资源以及昂贵的仪器设备通过高速的网络连接起来,形成高性能的计算环境,实现广泛资源共享的新技术已逐渐成熟。本课题所研究的就是应用网格的资源监控技术实现校园网内的资源监控系统,它是应用网格技术实现校园网资源共享的底层支撑部分。 本论文首先介绍了网格计算及其发展历史,然后对网格底层资源监控系统进行了理论和体系结构的剖析,并结合校园网特点,提出了本系统的体系结构和设计目标,并对校园网内资源监控系统的下述几个方面进行了研究和实验。 1、本系统的数据模型:本系统具体实现了将静态数据和动态数据灵活地结合在一起,存储在目录信息树中,减少了一次客户端到服务端的交互。 2、本系统的监控对象:结合实现校园网资源共享对底层信息的需求,提出了本系统所要监控的对象;本系统实现了对被监控主机的系统类、网络类、应用类资源的监控。 3、本系统的体系结构:本系统采用了带中间件的叁层体系结构,有效地解决了消费者直接访问被监控对象带来的安全问题和由于直接访问被监控对象带来系统的冲击。 4、实现了数据的发布和订阅:实现了消费者根据自己的需求向信息生产者进行订阅,消费者根据具体情况可以设定数据刷新频率和过滤值。 5、系统的扩张性:本系统具有一定的扩张性,支持系统的动态加入和离开,并通过LDAP的异步远程复制(asynchronous remote replica)机制提供向上一级的数据汇总。 6、对异构资源互访的支持:通过数据组织和分层结构,及函数接口向用户提供了统一的资源对象接口,解决了异构系统互访的问题。 7、本系统增加了对应用服务的监测:能够根据系统内运行进程或进程组的实际运行状态,监测出系统实际服务运行情况。 8、本系统增加了实时监测系统打开的端口:本系统能够监测出所有进程打开的端口,包括系统的8号进程所打开的端口,并把系统开启的端口与应用它的进程一一对映出来,为系统的网络安全提供了支持。 最后完成本系统的设计和开发,该系统可以监测校园网内主机资源的动态参数,能够很好地为实现广义的校园网资源共享提供底层的支持。

黄谦[8]2007年在《网格监控系统关键技术研究与实现》文中研究指明网格计算技术被认为是最能解决广域范围资源共享和协同计算问题的计算解决方案,它适应现今人们对服务和信息的随时随地的需求,网格计算发展到今天,Web服务已经成为网格中间件和统一网格资源的趋势。它还是面临许多需要解决的问题。网格要解决广域范围内大量异构服务的共享和协同,这些服务和网格的用户具有频繁动态变化的特性,这就必须有一套网格的监控机制,解决如何实时、准确地获得网格服务的信息,以达到及时发现故障、维护负载平衡的目的。因此对网格服务监控技术的研究具有重要的学术意义和应用价值。本文说明了网格服务监控的特点,分析了网格服务监控的关键技术。提出了一体化的网格监控体系结构,设计了适合网格监控发展的信息模型和底层探测器的按需构造机制,设计了网格监控机制历史数据分析与管理的框架,研究了基于小波支持二乘向量机的网格负载信息预测模型,实现了带信息分级搜索功能的网格服务监控管理系统GridEye,以向网格用户、管理者和应用提供实时的、统计的网格服务的信息状况。该系统采用多中心的分布式结构设计,能对分布在广域范围内各种异构的分层次的资源监测与控制,并为上层应用提供资源监控信息支持。该系统经过了严格的功能和性能测试,已在CNGrid(中国国家网格)环境中部署和运行。

王复盛[9]2007年在《基于Agent的网格资源监控技术研究》文中指出网格资源监控是网格若干重要问题中的一个。在网格计算环境中存在各种动态的资源,它们在地理位置上是分布的,在运行平台上是异构的,又可以动态地加入或离开不同的虚拟组织。因此,如何有效的发现网格资源,监控网格资源状态,使网格应用程序能够准确的使用各种资源就成为必须要解决的问题。本文首先分析和研究了网格资源监控的研究现状以及目前存在的一些问题,并详细地分析网格资源监控和Agent技术,然后,对网格资源的监控提出了一种新的方法,方法引入了Agent技术和LDAP技术,设计和实现了虚拟网格环境和多个网格节点,为今后网格技术的研究和实验打下了良好的基础。本文还利用IBM的Aglet软件设计并开发了多个Agent,并将其应用到网格资源监控中,仿真实现了GRMA系统。Agent的引入是通过将服务请求Agent移动到目标主机,使得Agent可以直接访问该主机上的资源,与源主机间的交互变少,避免了大量数据在网络中的传输,从而降低了整个系统对网络带宽的依赖,缩短了通信时延,提高了服务质量。设计了LDAP目录服务器,并将其应用到网格资源监控系统中。LDAP的引入可以很好地提供安全性,并且快速得到监控结果。当访问远程域或域间的网络性能监控数据时,可以利用LDAP的异步远程复制或通过代理访问远程LDAP进程来获得监控数据。

倪广宝[10]2005年在《网格监控系统GridView的研究与实现》文中进行了进一步梳理随着高性能计算应用需求的发展,单台高性能计算机已经不能胜任一些超大规模应用问题的解决,这就需要将地理上分布的、异构的多种计算资源通过高速网络连接起来,共同解决大型应用问题。网格是将大量异构的、地理位置分布的资源整合成一台巨大的超级计算机,实现各种资源的全面共享。为了有效的利用网格中的资源,提高网格中资源的利用效率,及时发现产生故障的主机,分析系统性能瓶颈,帮助用户在最短时间内恢复或调整系统,网格监控就显得尤为重要;监控数据还可用来预测系统运行的轨迹,为网格动态负载均衡策略提供可靠的依据,保证网格的健壮性和可用性。本文主要的主要工作有以下几个方面:1.研究了网格监控系统的结构,并针对网格环境下的特点讨论了网格监控系统的关键问题。在总结和分析已有监控系统的基础上,提出了自己的网格监控系统的体系结构。在网格环境下,由于资源数目非常多,随着时间的推移,网格中资源的数目还会变化,因此网格监控系统在结构上必须有较好的可扩展性。监控系统的各部分之间应该松耦合,以便于监控系统在分布式环境下的部署。同时针对网格环境下的特点讨论了设计和实现网格监控系统要解决的其它关键问题。2.海量监控数据的处理技术。网格是由大量资源组成的一个资源共享系统。如此大量的资源会产生大量的监控数据,如何处理这些监控数据既可以减少其对存储资源的消耗,又尽可能的降低精度的损失,保证历史归档数据的真实性,这是海量监控数据的处理技术要解决的问题。3.监控数据的可视化问题。为了将网格作为一个逻辑上的整体,对用户提供方便和透明的访问,必须将网格中的资源作为一个有机整体为用户提供统一的逻辑视图。网格监控系统将监控的所有资源信息以各种逻辑视图提供给用户,使用户方便快捷的获取所要得到的信息,同时便于操作,符合人机交互界面的设计原理。4.实现了网格监控系统GridView并对其进行了评价。在充分分析现有监控系统的基础上,设计和实现了网格监控系统GridView,其结构具有较好的可扩展性,容易的实现对多个机群的监控,并对其性能进行了分析和评价。

参考文献:

[1]. 网格环境下资源监控的研究及应用[D]. 王志瑞. 河海大学. 2007

[2]. 网格环境下资源监控系统的研究与实现[D]. 田鸣华. 国防科学技术大学. 2004

[3]. 校园计算网格监控系统研究与实现[D]. 李江卫. 西北工业大学. 2007

[4]. 基于Ganglia和MDS的校园计算网格监控研究[D]. 彭武杰. 成都理工大学. 2010

[5]. 面向网络计算的作业调度系统关键技术研究[D]. 梁毅. 中国科学院研究生院(计算技术研究所). 2005

[6]. 网格资源监控技术的研究与实现[D]. 单今乐. 国防科学技术大学. 2005

[7]. 应用网络技术实现校园网的资源监控系统[D]. 宋智礼. 北方工业大学. 2004

[8]. 网格监控系统关键技术研究与实现[D]. 黄谦. 国防科学技术大学. 2007

[9]. 基于Agent的网格资源监控技术研究[D]. 王复盛. 长沙理工大学. 2007

[10]. 网格监控系统GridView的研究与实现[D]. 倪广宝. 中国科学院研究生院(计算技术研究所). 2005

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

网格环境下资源监控系统的研究与实现
下载Doc文档

猜你喜欢