基于消息传递的机群机间通讯系统

基于消息传递的机群机间通讯系统

毛永捷[1]1997年在《基于消息传递的机群机间通讯系统》文中提出并行处理与并行计算机是当今计算机科学研究的热点之一,并行计算机以其卓越的性能日益受到世人的瞩目。其中,基于消息传递的并行计算机逐渐成为了超级计算机发展的主流,它包括两种机型:大规模并行处理机和机群。本文以基于消息传递的机群系统为原型,给出了机群机间通讯系统的性能评价模型,并详细地介绍了该系统的实现方案。 随着半导体工艺的日新月异,处理器越来越快,并行计算机的性能提高越来越依赖于相对较慢的通讯系统功能和效率的改善。一方面,通讯系统带宽和延时性能的提高,能直接加快消息传递的过程,使解题速度加快;另一方面,实现计算与通讯在时间上的重叠,能从宏观上隐藏通讯开销,从而使延时大大减小。通讯系统设计的好坏,直接关系到并行计算机的解题速度和解题规模。 本文讨论了机群机间通讯系统的数据链路构成,将其大致分为两种链路模型:单链路缓冲机制和基于Wormhole机制的二维Mesh网络。文中详细分析了它们的带宽、延时性能与数据流量和数据缓冲区的关系,给出了机群机间通讯系统的性能评价模型。 根据这样的性能评价模型,当数据流量比较小、Mesh网络负载比较轻时,机群机间通讯系统的延时与通讯距离近似无关;在数据流量比较大、Mesh网络负载比较重时,随着网络负载率的升高系统延时迅速增大。在稳定的数据流量下,系统带宽取决于最小的子链路带宽;在数据流量不稳定或网络出现阻塞时,缓冲机制将适时地发挥作用。同时,在考虑信道噪声的情况下,一定间隔的数据缓冲区将有可能使误码率降低。 机群机间通讯系统的关键设备—PMI的实现,是本文进

孟丹[2]1998年在《机群高效通讯系统的研究与实践》文中研究说明随着近年来商用微处理器性能的迅速提高,机群系统变得越发引人注目。人们预期,由于在可扩展性和性能价格比等方面存在的优势,机群系统将成为高性能服务器领域的一种主流平台。由于机间通讯是制约机群系统性能的一个关键,因此成为机群研究中的热点。本文结合国家“863”重点项目曙光2000高性能计算机的研制对机群系统中高效机间通讯系统进行了深入的研究,提出了一种全新的消息分类方法和基于这种分类方法的软件通讯协议,同时设计了一种綦于盈余(credit)的动态流量控制算法和相应的死锁防止方法,解决了通讯软件的可扩展性问题。在性能分析的基础上本文对影响机间通讯性能的主要因素做了分析并对通讯系统的两种主要结构进行了比较。 本文的工作主要包括以下几个方面: 1.对与机群机间通讯系统相关的问题进行了深入、细致地研究,尤其是对系统域网的概念和特征进行了探讨,同时在对当今世界上有代表性系统进行分析比较的基础上提出了机群机间通讯系统设计实现中面临的一些关键问题和已有的解决策略。 2.提出了一种全新的消息分类方法和相应的软件通讯协议。目前已有的消息分类方法只是依据PIO和DMA在传输数据时性能的差异而简单地将消息分为长短两类。在此基础上,新的分类方法还将内存拷贝、进出操作系统核心以及虚实地址转换等开销以及流量控制的需求考虑在内。依据新的分类方法,消息被分作四类,并采用不同的协议进行传送。在此分类方法和软件通讯协议基础上实现的底层通讯库API消除了对其用户数据缓冲区的任何限制,理想情况下可实现数据在由用户发送缓冲区到接收缓冲区间传输过程中真正意义上的零拷贝。 3.设计出一种基于盈余的动态流量控制算法和相应的死锁防止方法。这种流量控制算法克服了传统的基于盈余的流量控制算法在可扩展性方面的缺陷,同时也避免了由发送方预留缓冲区所可能造成的数据包在网络上做无谓的传递和用于对无序数据包进行接收的开销。使用新的算法,消息接收方为所有可能的发送方所预留的缓冲区大小不会随应用规模的扩大而呈线性增长。 4.介绍了曙光2000机间通讯软件在采用传统网络接口和智能网络接口两种不同的通讯系统结构中的实现策略。通过对在传统网络接口上实现的底层通讯软件性能的分析和对在智能网络接口上实现的底层通讯软件性能的估算,本文对这两种结构进行了比较并试图阐明它们各自的优缺点。

肖利民[3]1998年在《机群高效通信系统研究》文中进行了进一步梳理在机群系统中,机间通信的性能是影响整个机群系统实际性能的一个关键因素。高效机间通信的设计和实现在机群系统的研制中占有非常重要的地位,一直是近几年来人们研究的热点。 本文首先在广泛了解已有机间通信技术的基础上,深入研究了机群机间通信系统设计和实现中的主流技术、关键问题及其解决策略。提出了在理想情况下机群高效通信系统应该实现的目标以及为达到这些目标通常采用的技术策略。然后着重选择机群高效通信系统设计和实现中的几个关键问题:网络接口的结构、消息的分类处理以及流量控制算法的设计等,进行了细致的分析和深入的研究。最后在两个实际机群高效通信系统的研制中,成功地运用了上述研究的成果。 具体地说,本文的工作主要包括以下几个方面的内容: 一.定义了机群高效通信系统的概念,刻画了其组成、功能、特征和基本结构,并在分析通信系统常用的几种评价模型的基础上,给出了综合评价机群高效通信系统的一般方法。 二.广泛和深入地研究了具有代表性的一些MPP和机群高效通信系统,并在总结这些系统研制经验的基础上,分析了机群高效通信系统研制中一些主流技术的背景、基本思想以及先进性,同时指出了机群高效通信系统设计和实现中应该考虑的一些关键问题以及解决这些问题的方法。 三.从互连网络、网络接口和通信软件三个方面,提出了在理想情况下机群高效通信系统应该实现的目标以及为达到这些目标通常采用的技术策略。 四.基于两种不同结构的网络接口,建立了它们各自的通信开销评价模型,分析和比较这两种模型的结果表明,在网络接口中增设通信处理器会增加通信软硬件实现的复杂度,但这种结构的通信系统,可以实现有保护的用户级通信以及通信过程中消息数据的零拷贝,与网络接口不含通信处理器的系统相比,在性能和功能两方面都有较大的优势。 五.基于不同的消息传输方式和数据通路,建立了相应的通信开销评价模型,分析这些模型的结果表明,根据长度等因素,对消息进行细致的

骆刚[4]2001年在《高速数字通信的研究—同步交换芯片与长线传输》文中研究说明随着计算机技术的发展,并行计算和并行处理已经成为当今计算机的热点。同时,并行计算机的性能提高越来越依赖相对较慢的通讯系统的功能和效率的提高。在硬件底层上,如何使数据传输变得更快,成为影响整个系统性能的关键因素。 随着机群系统的兴起,特别是工作站机群的兴起,机群节点间的分布比较分散,数据的异步传输方式使得长线问题在通讯系统效率上的影响越来越明显。而通讯系统的设计又直接关系到大型计算机系统的解题速度和解题规模。当前需要解决的问题,就是交换方式和长线传输。 本文讨论了机群机间通讯系统的硬件结构,分析了现有的通讯系统在有长线的情况下传输频率和带宽受到影响的主要因素,在交换方式方面,提出了把现有的异步交换改为同步交换的解决办法。参考国外先进的交换机的发展现状,分析它们的优缺点,并结合现有条件,讨论了交换机实现的技术策略,给出了一种同步交换芯片---UX8的原型设计方案,包括调试方案和改进途径。 在针对长线传输问题方面,设计实现了一个系统原型MultiSlack,用它解决长线问题,目的是使得传输频率和线长无关。文章就该系统的模型做了理论分析,从系统的设计实现到测试都给出了详细说明,并就关键技术问题的原理和实现做了详细论述,罗列了部分测试结果,对其进行了分析。最后就问题的发展和方案的改进做了论述。

参考文献:

[1]. 基于消息传递的机群机间通讯系统[D]. 毛永捷. 中国科学院研究生院(计算技术研究所). 1997

[2]. 机群高效通讯系统的研究与实践[D]. 孟丹. 中国科学院研究生院(计算技术研究所). 1998

[3]. 机群高效通信系统研究[D]. 肖利民. 中国科学院研究生院(计算技术研究所). 1998

[4]. 高速数字通信的研究—同步交换芯片与长线传输[D]. 骆刚. 中国科学院研究生院(计算技术研究所). 2001

标签:;  ;  ;  ;  

基于消息传递的机群机间通讯系统
下载Doc文档

猜你喜欢