分布式计算机系统动态负载平衡的研究

分布式计算机系统动态负载平衡的研究

牛雪征[1]2003年在《分布式计算机系统动态负载平衡的研究》文中进行了进一步梳理动态负载平衡是分布式系统中的一个研究热点。本文利用在线跟踪技术,获得作业的行为特征(资源需求和执行时间等),从而筛选出那些不值得转移的短作业;并且根据作业对各种资源的需求情况,为作业寻找一个更能满足其资源需求的执行节点;同时根据作业的不同行为特征,指出仅用CPU队列长度作为负载指标的缺陷,验证了使用资源利用率为主要负载指标,资源队列长度为次要负载指标的合理性。另外,本文还讨论了不同的负载环境对于不同类型作业响应时间的影响,并以此为依据来估计作业转移的收益与开销,将一个基于收益与开销的新的选择策略应用到负载平衡算法中。此外,本文以执行时间最短为评价标准,为将要转移的作业寻找最佳执行主机。性能测试的结果表明,本文所提出的方法能够较好地缩短作业的平均响应时间和提高系统的资源利用率,实现了动态负载平衡的目的。

张先哲[2]2009年在《分布式系统中的负载平衡检测与优化策略研究》文中研究指明分布式系统因其并行性可以降低处理的瓶颈,提供更好的性能价格比,并且具有在系统出现故障的情况下继续运行的潜力,因而得到了越来越广泛的研究和应用。然而由于分布式系统中结点的自治性,常会出现系统运行一段时间后一些结点的任务仍然很多,称之为超载,而部分结点却处于空闲状态,称之为轻载,这种空闲与忙等待并存的情况严重影响了系统的整体性能。负载平衡的目的就是尽量平衡系统各结点的负载以提高系统整体性能。前人在此方面也做了很多工作,提出了多种负载平衡策略及算法,但仍然存在一些问题。本文针对负载平衡过程中出现的负载评价和抖动问题,提出了一种新的分布式系统负载平衡策略,重点在负载平衡检测和优化方面。本文首先分析介绍了分布式系统的发展史以及其软件硬件支持,详细给出了分布式系统的结构。其次,介绍了负载平衡的相关知识,其中重点介绍了动态负载平衡。最后,提出了一种新的分布式系统负载平衡策略,并给出了其算法基本流程。本文的主要贡献首先在于在负载平衡检测方面,引入了多项重要负载指标,综合评价结点负载状况,定义了结点动态负载值。鉴于目前算法大多只把CPU队列作为负载指标,本文根据任务的不同类型给各个负载指标设置不同系数以区别各个负载指标的重要性,并将结点的动态负载值作为判断结点轻载重载的依据。这样可以较准确有效的获取结点负载状况,使超载结点迅速转移超载部分任务而不再继续接收新任务。其次,在负载平衡优化方面,引入系统管理站和实时负载值。由管理站负责周期收集并计算记录结点负载,避免了忙结点向系统广播超载信息,一定程度上减轻了忙结点的负担。同时管理站根据结点动态负载值和初始负载值计算结点的实时负载值,并生成接收结点负载线性表,以供超载结点查找最优空闲结点,从而减少任务的响应时间,同时避免因任务多次迁移得不到执行而引起的抖动现象。最后,设计负载平衡系统模型,并利用OPNET对负载平衡系统进行仿宾建模,以求素数为例对各结点CPU利用率进行比较分析,以验证平衡策略的有效性。

曲全民[3]2014年在《一种高效的负载平衡算法研究与设计》文中进行了进一步梳理分布式并行计算可以提供相对廉价且强大的处理能力,在研究和应用领域都得到了广泛的关注。负载平衡是影响分布式并行计算性能的重要因素之一,负载平衡策略的效率直接关系到分布式并行系统的执行效果。负载平衡作为提高分布式并行计算性能的关键技术,是一个NP问题,因此分布式并行系统只能通过优化得到近似解而不能获得最优的负载平衡。分布式并行系统具有的特点也进一步增加了负载平衡难度:首先,分布式并行计算系统中节点的异构性和任务的异构性增加了负载平衡策略的难度;其次,网络的异构性也对负载平衡策略提出了挑战;再次,分布式并行系统的不断扩展要求负载平衡策略具有良好的可扩展性;最后,负载平衡策略需要适应分布式并行系统的动态性。这使得,目前对负载平衡的研究在任务调度模型、算法复杂程度、信息获取、数据传输代价、调整策略等方面存在一些问题。针对上述问题,本文在现有研究的基础上设计了任务调度模型,并基于此模型提出一种简单高效的负载平衡算法。(1)针对分布式并行环境的特点设计了任务调度模型。首先,抽象出包含处理数据的任务和纯计算任务的任务模型。其次,抽象出接近实际的系统结构;基于历史值的影响设计了考虑工作节点计算能力动态性和异构性的处理机模型;提出标准网络距离的概念,更好地处理网络的动态变化和计算通信开销,并基于此设计了包含局域网和广域网的通信模型。最后,根据设计的模型给出任务组织形式、迁移方式以及本文负载平衡算法要解决的问题。(2)基于设计的任务调度模型提出一种高效的负载平衡算法。算法将负载平衡分为Assignment和Redistribution两个过程,针对两个过程分别提出了简单且准确性较高的任务调度算法(SHAS:Simple and High Accuracy Scheduling Algorithm)和基于性能收益因子的动态负载调整算法(DLAPGF:Dynamic Load Adjustment Algorithm based on Performance Gains Factor)。SHAS结合了按需和周期性的信息收集方式,并采用捎带信息的方式进一步提高信息的准确性,在此基础上充分考虑通信开销和数据传输代价,提出任务最终完成时间较准确的计算方式,最后在提出的任务调度原则的指导下采用Min-Min算法对新任务进行调度。DLAPGF通过分析得出负载平衡目标,然后基于标准网络距离确定伙伴节点,并采用改进的交互信息反馈方式获取伙伴节点的信息,最后根据工作节点的最终完成时间提出性能收益因子的概念,并在此概念的基础上采用任务交换和任务迁移操作实现动态调整策略,降低了数据传输代价。同时SHAS和DLAPGF在一定程度对系统的动态性进行了处理。(3)基于系统完成时间、系统平衡性、数据传输代价和消息开销四个性能指标,分别对SHAS和DLAPGF的实验结果进行对比和分析,表明了提出算法的有效性。同时,验证了参数和系统动态性对算法效率的影响。

杨夏妮[4]2008年在《基于Petri网的负载平衡双层调度模型的研究》文中研究说明负载平衡技术是一种提高分布式系统整体性能和吞吐量的有效方法。本文针对目前负载平衡调度算法存在的不确定性、不完全性和不稳定性问题,负载平衡调度一般模型的单一层次问题以及被大规模系统忽略的集中式调度策略优点的问题,提出一个将集中式调度的易管理性、易实现性和分布式调度的可扩展性相结合的动态负载平衡双层调度模型。该模型将分布式系统分成若干个相对独立的任务调度组,每个任务调度组由一个调度服务器和叁个工作站组成,任务调度组内部采用集中式调度,而任务调度组之间采用分布式调度,顶层子系统和底层子系统分别由每个任务调度组的调度服务器和工作站组成。在对动态负载平衡双层调度模型进行描述的过程中,主要根据负载平衡调度一般模型的分布式系统的网络环境、任务集、负载指标和负载平衡调度策略这四个组成部分描述了模型的实现原理、实现规则等,并应用Petri网理论对该模型进行建模。应用Petri网理论构建出来的模型与常用的模型仿真方法和基于数学分析的方法构建出来的模型相比,更能反映系统的动态行为特征,更具有灵活性。Petri网除了是建模工具之外,还被认为是迄今研究系统性能的最有力的工具。在完成动态负载平衡双层调度模型的建模之后,根据该模型的特点提出了系统的设计方案,并利用Petri网对该系统进行性能评价。将在动态负载平衡双层调度模型下采用的集中式调度和分布式调度相结合的策略与负载平衡调度的一般模型下常用的几种动态负载平衡调度策略的进行对比分析后,实验结果表明,该模型能够减少系统的平均响应时间,提高系统的吞吐量,从而有效地提高分布式系统的效率。

何入海[5]2002年在《基于Linux的集群系统的研究与实现》文中研究表明计算机集群是随着分布式计算机系统而发展来的,特别是近年来Internet的出现,对集群技术的要求越来越高。集群是一种低成本的分布式计算机系统,它由很多工作站或者PC节点组成,它能提供高可用性和高性能。集群根据功能可分为高可用性集群、负载平衡集群、高性能集群。集群系统对于软件和硬件的要求相对于普通的计算机来说有一定的差别,特别集群需要在延时较低、可靠性较高的网络系统能更好的工作。集群系统相对其它计算机系统来说其关键技术在于:负载平衡技术、进程放置和进程迁移技术、集群文件系统。集群技术有很多的解决方案,大都是基于商业操作系统而设计的,因此成本较高。Linux操作系统是基于GPL开放源代码的免费的操作系统,从成本和技术来讲更容易实现集群系统。在国外对Linux的集群的研究正方兴未艾,产生了较多的集群系统,国内现在正处于起步阶段。本文是结合重庆信息港建设的低成本高性能方案的一个重要组成方案,研制出适合信息港建设的集群系统满足其低成本高性能的要求。本文首先从集群系统的基本方面入手分析了基本技术以及集群的关键技术。然后对设计一个集群的软件和硬件进行了详细的分析,特别是对集群的软件体系结构做了较深的研究。由于单系统映像集群对用户来说容易操作而且在集群上的应用软件也交易于实现而成为今后集群系统设计的标准。本文通过集群的软件和硬件进行了具体的研究以及单一系统映像集群的特征进行了分析,设计了一个基于Linux的单一系统映像集群的软件系统模型。负载平衡是集群系统设计的一个很重要的组成部分,本文对负载平衡机制和负载平衡策略进行了研究,常见的负载平衡算法有静态、动态和自适应算法叁类,其中动态负载平衡算法具有较强的研究价值,本文对动态负载平衡算法进行了较为深入的研究。最后通过对Linux虚拟服务器集群系统的五种负载平衡调度算法进行深入分析,对其中一种算法进行了优化,并且通过实验进行了验证。在理论的基础上建立了一个基于Linux的集群系统的示范平台,以对重庆信息港建设的高性能、低成本的Linux建设方案其指导作用。

龚卫华[6]2006年在《数据库集群系统的关键技术研究》文中认为目前大型DBMS在海量数据的OLTP商业应用中已成为制约整个信息系统性能和效率提升的瓶颈,传统的提高单机的硬件配置和优化数据库系统性能参数的方法也只能有限地提高系统性能。因此,基于多机并行处理的数据库集群成为人们关注的热点,它以高性能、高可用性和高可扩展性为目标,在高性能计算、海量数据的存储和处理、Web服务、电子商务等领域有着广泛的应用。围绕数据库集群系统的并行性能,主要从系统结构、全局事务的并发控制、负载平衡以及数据分布等方面解决了集群系统中的一些关键问题。为了将集群技术应用于数据库系统以实现大规模和高并行性能的数据库集群系统,在无共享的数据库集群基础上设计了一种通用的、具有高并行性能的中间件系统,提供单一系统映像结构,采用元数据管理、多线索机制、并行事务预处理等技术,实现了数据库集群的协作与并行处理,能满足对性能要求较高的OLTP商业应用,具有理想的性价比。该系统既保持了集群中局部数据库站点的自治性,又提高了数据库集群系统的并行性能,解决了大型DBMS的性能瓶颈。在并发控制方面,为了保证集群系统中全局事务的并发正确执行,采用基于谓词级的多级粒度冲突检测机制,并通过检测谓词冲突图中是否存在环的方法来避免冲突的全局事务可能会产生的全局死锁,不仅减小了死锁检测粒度而且还提高了全局事务处理的并发度,同时也保持了集群中局部数据库的自治性。此外,还改进了一种以事务提交图为中心的并发事务调度算法来保证全局事务的可串行化提交,实验比较结果表明该算法有效地提高了全局事务执行的并发度,增加了事务吞吐率和减少了响应时间。负载平衡是集群系统获得高并行处理性能和提高资源利用率的有效手段,集群中的负载平衡器根据同构或异构节点上的CPU、内存和磁盘I/O等计算资源在不同负载下的综合利用率来衡量节点的加权负载状态,所提出的基于阈值的动态负载平衡算法不仅考虑了资源的利用率,而且还考虑了负载类型对集群系统性能的影响。实验证实该策略不仅动态地保持了系统的负载平衡,而且还充分发挥了各节点的计算能力,提高了系统中各计算资源的利用率。数据分布平衡是影响数据库集群系统性能的重要因素,现存的一些数据划分方法把关系和数据都均匀地分布到多个处理节点上,而没有考虑异构节点间计算能力的差异,使得数据库集群的并行处理能力没有被充分地发挥,因此,提出了适合于同构及异构集群中数据分布的改进的Range划分方法,根据集群中同构或异构节点的计算能力将数据不均匀地分布各节点上,克服了传统的数据均匀划分的缺点。针对系统负载中发生的数据倾斜,所采用的联机数据迁移算法根据负载访问特点把过载节点上的热点数据迁移到轻负载的节点上以分担系统负载,其优点是不仅有效避免了数据执行倾斜,提高了事务吞吐率,也保持了集群系统的动态平衡。最后,综合分析和评价了同构及异构数据库集群系统的各种并行性能度量指标,TPC-C测试结果表明数据库集群系统在并行OLTP处理中具有良好的可扩展性、次线性的加速比、以及高性价比的并行处理服务,为满足电信、金融等领域大规模OLTP处理的需要打下坚实的基础。

张庆[7]2007年在《负载平衡系统中一种基于多agent和动态冗余技术的通用机制》文中提出工作站网络(network of workstations NOW)和Internet工作站(workstation in Internet WII)已经成为传统高性能分布式计算环境的一个高效可行的替代方案,但NOW和WII都面临着有效使用资源的问题,所以解决负载平衡问题是提高NOW和WII性能的重要因素。负载平衡分为静态,动态和混合式叁种,现在研究的重点多集中于动态负载平衡。动态负载平衡中的任务调度分为集中式调度和分布式调度,前者由一个任务调度器负责收集系统负载信息,决定任务调度方案;后者由每个节点上的调度程序共同决定任务调度方案。在采用集中式调度的动态负载平衡系统中,任务调度器往往成为系统的瓶颈。很多文献研究了各种负载平衡策略,但都没有系统完整地研究恶劣环境下分布式计算环境中负载平衡系统的容错性问题。采用集中式调度的负载平衡系统对恶劣的环境显然是非常敏感的,一旦调度器发生异常,整个系统就会瘫痪,此时调度器就成为系统的瓶颈;在采用分布式调度中的负载平衡系统中,虽然每个节点都可以扮演调度器的角色,但是只要存在发生异常的节点就会影响全局调度的正确性。所以负载平衡系统的容错性是值得重视与研究的一个问题。近些年来agent技术在分布式系统的开发过程中正发挥着越来越重要的作用,日益引起人们的高度重视。越来越多的研究人员投入到这一富有挑战性的研究领域,并取得了不少研究成果。MAS的提出可大大提高系统实现的效率和易维护性,更重要的是按照这种方式设计实现的系统更接近客观世界模型,由此又可提高系统的环境适应性。所以考虑将MAS应用于负载平衡系统的设计是一种可行的选择。本文提出了采用集中式调度的动态负载平衡系统的一种通用机制。该机制通过multi-agent系统提高了分布式系统中各节点的通讯效率。节点中的agent被分为五种:监控agent,冗余选择agent,主从交互agent,任务执行agent,任务调度agent。各个节点中的agent相互协作,使所有节点都准确而快速有效地知道整个系统中节点的拓扑结构,并且整个系统的整体负载情况也能及时而又快速地被中心调度器得到,这使得负载平衡的决策更加准确。论文中详细分析了采用双机备份方式作为系统容错选择的合理性,为了解决中心调度器成为瓶颈的问题,提出了动态冗余机制,它是一种基于双机热备份方式地容错技术,具有动态性和高可靠性地特点。这种机制的动态性是以多agent间的协作实现的。动态冗余机制使得在不改变系统可用性的前提下有效地提高了整个系统的容错性能。尤其是在恶劣的环境中,中心调度器比较容易出现故障的情况下,该机制的优势更为明显。该机制是通用的,所以具有广泛的应用,并且具有灵活的实现方法。

肖育劲[8]2003年在《基于网络的分布式机群并行仿真平台开发》文中研究指明本文深入地分析了分布式并行计算技术,开发了基于网络的分布式机群并行仿真平台。本文在综合分布式计算、网络并行计算的各方面文献和当前的多种典型机群管理系统的前提下,结合实际情况提出了由主服务器、节点机构成的基于局域网络的分布式机群并行仿真平台体系结构。机群计算中负载平衡一直是一个很关键的问题。本文中在综合各种负载指标的文献后提出了较为完善的节点负载计算方法,并且引入双阈值的概念提出了具有特色的动态自适应负载平衡算法,使各节点在空闲或轻负载时能够主动地向服务器申请,在重负载时能更快地进行负载迁移。机群管理系统可用GUI工具从不同层次上观察整个机群状态。好的管理软件对开发高性能计算平台的机群是非常重要的。本文开发的的系统管理平台SIMNOWs是用户直接面对的部分,完成系统设计、任务调度、分配和统一管理等功能。整个系统管理平台包括如下模块:系统整体功能模块、作业管理功能模块、节点管理功能模块、通讯管理功能模块等。循环流化床模型的仿真计算是一个较大任务量的计算程序,在一般的计算环境下难以实现。因此我们先在服务器上单机运行仿真程序,然后与在SIMNOWs系统下进行的并行仿真计算相比较,得出后者具有较好的效果的结论。

刘艳[9]2003年在《分布式网络并行系统在舰载指控系统中的应用研究》文中进行了进一步梳理分布式系统比单机系统具有更高的性能和可靠性,并且随着互联网的普及和某些应用本身所具有的分布式特性,使其应用日益广泛。但是,对于网络分布式系统来说,当系统的任务量过重时,单机处理速度的瓶颈、网络拥塞和延迟、负载分布的不均衡,使分布式系统达不到预期的性能要求,因此进一步提高分布式系统的性能是一个急待解决的问题。 本文结合了分布式系统和并行系统的优点,将单机结点的分布式系统改造为网络并行计算结点的分布式系统,并首次应用于海军综合电子系统的重要组成部分——水面舰载指控系统中,由于网络并行计算结点的处理速度高于单机结点,从而提高了整个分布式系统的处理速度。同时,本文还深入分析了基于网络的并行计算系统程序设计方法,对本课题所研究的舰载指控系统原有的分布式体系结构按照并行化的思想进行了优化;提出了一种适合目前海军舰载指控系统作战要求的分布式网络并行体系结构;讨论了这种体系结构的可行性和性能优势。另外,本文根据前面提出的分布式网络并行舰载指控系统体系结构的特点,通过研究目前各种并行系统负载平衡算法,提出一种适合于这种网络并行分布式体系结构的负载平衡解决方案,即基于优先级的任务请求动态负载平衡,使系统的稳定性和可靠性得到了一定的提高。 本文所提出的分布式网络并行体系结构和适应于这种体系结构的负载平衡方法在舰载指控系统仿真平台上做了仿真试验,证明这种方法的应用使舰载指控系统在性能上比原有的分布式系统有所提高,从而验证了本文所提出的方法具有一定的实用价值。

牛铁[10]2003年在《利用Java对网络分布式计算相关技术的研究》文中提出多数分布式计算系统采用C/C++语言开发,虽然它的工作效率很高,但在可移植性、后期维护及安全性上存在不足。本文将Java技术应用在分布式计算系统上。其意义在于利用Java语言的跨平台特性降低软件开发成本提高可移植性;利用Java语言的安全模型使分布式计算参与者的计算机系统减少被恶意攻击的可能;利用代码迁移减少分布式计算系统在改变用途时被重复开发的可能。 本文利用Java多线程技术解决了客户端空闲时间的探测与使用;运用Java类装载和反射机制解决计算任务的自动加载与运行;利用Java安全模型增强分布式计算系统客户机安全;结合JDBC技术使用工作池方法实现动态负载平衡;使用RMI技术实现客户机与服务器间通信等。最终本文实现了一个简单的分布式计算系统实验模型,它的特点是在客户机与服务器间传递的不仅是数据还有可执行的程序。该实验模型验证了上述工作的可行性。

参考文献:

[1]. 分布式计算机系统动态负载平衡的研究[D]. 牛雪征. 南京航空航天大学. 2003

[2]. 分布式系统中的负载平衡检测与优化策略研究[D]. 张先哲. 河南大学. 2009

[3]. 一种高效的负载平衡算法研究与设计[D]. 曲全民. 东北大学. 2014

[4]. 基于Petri网的负载平衡双层调度模型的研究[D]. 杨夏妮. 广西大学. 2008

[5]. 基于Linux的集群系统的研究与实现[D]. 何入海. 重庆大学. 2002

[6]. 数据库集群系统的关键技术研究[D]. 龚卫华. 华中科技大学. 2006

[7]. 负载平衡系统中一种基于多agent和动态冗余技术的通用机制[D]. 张庆. 山东大学. 2007

[8]. 基于网络的分布式机群并行仿真平台开发[D]. 肖育劲. 重庆大学. 2003

[9]. 分布式网络并行系统在舰载指控系统中的应用研究[D]. 刘艳. 哈尔滨工程大学. 2003

[10]. 利用Java对网络分布式计算相关技术的研究[D]. 牛铁. 大连海事大学. 2003

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

分布式计算机系统动态负载平衡的研究
下载Doc文档

猜你喜欢