二维Mesh网上消息传递软件的分析与实现

二维Mesh网上消息传递软件的分析与实现

张浩[1]1995年在《二维Mesh网上消息传递软件的分析与实现》文中研究指明基于消息传递的大规模并行处理系统是当前超级计算市场的主流,如何减小消息传递的开销并使得程序运行时的计算和通信能够相互重叠是提高并行程序的加速效果的关键所在。本文采用两种方法从内部和外部的两个角度分析了曙光1000上现有的NX消息传递库的性能和开销,发现影响其效率的原因主要在于其复杂的缓冲区管理机制和慢速的消息拷贝。并在此基础上,采用了Active Message的消息传递机制,在曙光1000上设计和实现了简单高效的消息传递软件DAM,大幅度地减小了消息传递的开销,使消息传递的效率提高了一个数量级以上。

肖利民[2]1996年在《大规模并行计算机系统通讯问题研究》文中研究指明并行处理是计算机研究领域中的一个热门课题。基于消息传递的大规模并行计算机系统逐渐成为超高性能计算机市场上的主流产品,它的性能在很大程度上取决于其内部处理机之间的通讯效率。 足够小的通讯软件开销以及实现计算和通讯在时间上的重叠是提高大规模并行计算机系统内部处理机间通讯效率的关键。传统通讯机制中的上下文切换、复杂的缓冲区管理以及慢速的内存数据拷贝,往往会造成过大的软件开销,不利于计算和通讯的重叠。因此有必要分析这些开销的来源并采取措施去尽量消除它们的影响。Active Message通讯机制充分利用了通讯硬件的异步特性,可以大大地减少消息发送和接收的软件开销,较好地挖掘出通讯硬件的潜能。 本文讨论了在曙光-1000大规模并行计算机系统上实施Active Message通讯机制的策略,设计和实现了基于Active Message机制的通讯软件和基于Active Message通讯软件的NX函数调用子集,并对曙光-1000的底层通讯(包括互连网络的传输延时和处理机读写网络通讯接口FIFO的时间开销)、Active Message通讯软件以及基于Active Message的NX函数调用进行了性能评价。 性能评价的结果表明,曙光-1000互连网络的延时较小,处理机读写FIFO的时间是硬件通讯开销的主要部分,Cache对降低通讯开销的作用明显;Active Message通讯软件有着很小的消息发送和接收软件开销,可以大幅度地提高通讯的性能,对于短消息,通讯开销可以降低一个数量级;并且以Active Message为基础实现的高层通讯软件在提高通讯性

肖利民[3]1998年在《机群高效通信系统研究》文中提出在机群系统中,机间通信的性能是影响整个机群系统实际性能的一个关键因素。高效机间通信的设计和实现在机群系统的研制中占有非常重要的地位,一直是近几年来人们研究的热点。 本文首先在广泛了解已有机间通信技术的基础上,深入研究了机群机间通信系统设计和实现中的主流技术、关键问题及其解决策略。提出了在理想情况下机群高效通信系统应该实现的目标以及为达到这些目标通常采用的技术策略。然后着重选择机群高效通信系统设计和实现中的几个关键问题:网络接口的结构、消息的分类处理以及流量控制算法的设计等,进行了细致的分析和深入的研究。最后在两个实际机群高效通信系统的研制中,成功地运用了上述研究的成果。 具体地说,本文的工作主要包括以下几个方面的内容: 一.定义了机群高效通信系统的概念,刻画了其组成、功能、特征和基本结构,并在分析通信系统常用的几种评价模型的基础上,给出了综合评价机群高效通信系统的一般方法。 二.广泛和深入地研究了具有代表性的一些MPP和机群高效通信系统,并在总结这些系统研制经验的基础上,分析了机群高效通信系统研制中一些主流技术的背景、基本思想以及先进性,同时指出了机群高效通信系统设计和实现中应该考虑的一些关键问题以及解决这些问题的方法。 三.从互连网络、网络接口和通信软件三个方面,提出了在理想情况下机群高效通信系统应该实现的目标以及为达到这些目标通常采用的技术策略。 四.基于两种不同结构的网络接口,建立了它们各自的通信开销评价模型,分析和比较这两种模型的结果表明,在网络接口中增设通信处理器会增加通信软硬件实现的复杂度,但这种结构的通信系统,可以实现有保护的用户级通信以及通信过程中消息数据的零拷贝,与网络接口不含通信处理器的系统相比,在性能和功能两方面都有较大的优势。 五.基于不同的消息传输方式和数据通路,建立了相应的通信开销评价模型,分析这些模型的结果表明,根据长度等因素,对消息进行细致的

孟丹[4]1998年在《机群高效通讯系统的研究与实践》文中研究指明随着近年来商用微处理器性能的迅速提高,机群系统变得越发引人注目。人们预期,由于在可扩展性和性能价格比等方面存在的优势,机群系统将成为高性能服务器领域的一种主流平台。由于机间通讯是制约机群系统性能的一个关键,因此成为机群研究中的热点。本文结合国家“863”重点项目曙光2000高性能计算机的研制对机群系统中高效机间通讯系统进行了深入的研究,提出了一种全新的消息分类方法和基于这种分类方法的软件通讯协议,同时设计了一种綦于盈余(credit)的动态流量控制算法和相应的死锁防止方法,解决了通讯软件的可扩展性问题。在性能分析的基础上本文对影响机间通讯性能的主要因素做了分析并对通讯系统的两种主要结构进行了比较。 本文的工作主要包括以下几个方面: 1.对与机群机间通讯系统相关的问题进行了深入、细致地研究,尤其是对系统域网的概念和特征进行了探讨,同时在对当今世界上有代表性系统进行分析比较的基础上提出了机群机间通讯系统设计实现中面临的一些关键问题和已有的解决策略。 2.提出了一种全新的消息分类方法和相应的软件通讯协议。目前已有的消息分类方法只是依据PIO和DMA在传输数据时性能的差异而简单地将消息分为长短两类。在此基础上,新的分类方法还将内存拷贝、进出操作系统核心以及虚实地址转换等开销以及流量控制的需求考虑在内。依据新的分类方法,消息被分作四类,并采用不同的协议进行传送。在此分类方法和软件通讯协议基础上实现的底层通讯库API消除了对其用户数据缓冲区的任何限制,理想情况下可实现数据在由用户发送缓冲区到接收缓冲区间传输过程中真正意义上的零拷贝。 3.设计出一种基于盈余的动态流量控制算法和相应的死锁防止方法。这种流量控制算法克服了传统的基于盈余的流量控制算法在可扩展性方面的缺陷,同时也避免了由发送方预留缓冲区所可能造成的数据包在网络上做无谓的传递和用于对无序数据包进行接收的开销。使用新的算法,消息接收方为所有可能的发送方所预留的缓冲区大小不会随应用规模的扩大而呈线性增长。 4.介绍了曙光2000机间通讯软件在采用传统网络接口和智能网络接口两种不同的通讯系统结构中的实现策略。通过对在传统网络接口上实现的底层通讯软件性能的分析和对在智能网络接口上实现的底层通讯软件性能的估算,本文对这两种结构进行了比较并试图阐明它们各自的优缺点。

霍吉东[5]2013年在《Delaunay四面体剖分并行算法研究》文中研究指明网格生成技术经过长时间的发展已经相对成熟。但近年来,随着大型并行计算机软硬件技术的快速发展,网格剖分并行技术已成为科学工程计算领域研究的热点之一。Delaunay四面体剖分凭借生成网格的高质量性和良好逼近性,其并行网格生成技术备受业界关注。本文主要研究Delaunay三角剖分性质、算法,提出了一种新的并行算法,重点研究了以下三个问题:1)本文将基于逐点插入思想的Delaunay网格剖分算法作为整体算法研究的核心。采用“网格生成算法+新并行策略”方式,在研究并行模式的基础上,基于数据并行的策略,生成了一种新的三维Delaunay三角剖分并行算法。2)在Linux+MPI平台上实现上述并行算法,同时将其应用到多核异构并行框架项目之中,取得了良好的计算效率。3)基于Gmsh环境实现了复杂地质体表面网格约束下的限定三维Delaunay剖分算法,且生成的网格质量良好。

刘刚[6]2006年在《多计算机互连网络上聚合通信算法的研究》文中研究说明现代科学、生活的发展越来越迫切地需要更强大的计算能力,而研制具有每秒万亿次、千万亿次处理速度的并行系统需要设计高性能的互连网络来连接大量的处理器。同时,随着系统规模的不断扩大,处理器之间的通信问题变得越来越突出。在大规模科学计算和工程应用中,聚合通信的开销往往占到全部通信开销的绝大部分。因此研究互连网络及相关的聚合通信算法对提高并行计算机的性能,进而提高并行应用程序的执行效率具有重要的意义。 本文围绕如何提高互连网络上聚合通信操作的通信性能这一问题,开展了以下研究工作: 本文首先深入研究了单端口环网结构上全交换操作的实现算法。环网结构是一种具有很好拓扑特性和应用前景的互连网络,是目前很多超级计算机广泛选用的互连拓扑结构。同时,全交换操作在并行计算领域中有着大量而且重要的应用。本文基于高维单端口环网结构设计了新型网络划分策略,并运用该策略在高维单端口环网结构上提出了通信量近似最优的间接全交换算法。与现有的其它相关算法相比,本文提出的高维全交换算法不仅具有很好的可扩展性,而且通信性能有特别显著的提高。 其次,本文改进了单端口二维和三维环网结构上具有最小启动时间的全交换算法。与原有算法相比,改进后的算法采用“自底向上再回送”的通信模式,在取得最小启动时间的同时,提高了算法整体的通信性能。 再次,考虑到目前多端口环网结构上全交换操作的研究不足,本文充分利用了多端口环网的多个通信端口,首次在多端口一维环、二维和四维环网上提出了通信量完全达到理论下限的间接全交换算法。分析结果表明,当消息较长时,与已有的相关算法相比,本文提出的多端口环网上的全交换算法具有更优的通信性能。 然后,基于由多台以太网交换机分层级联而成的机群系统,本文提出通信量达到理论下限的直接全交换算法DCE和间接全交换算法MCCE。全交换算法MCCE不仅达到了通信量的理论下限,而且大幅度地减少了消息启动开销和同步开销,进一步提高了全交换操作的通信性能。实验结果表明,当消息较长时,本文提出的这两个全交换算法在上述机群系统中明显优于MPICH和LAM/MPI中实现的全交换算法。 接下来,针对传统的基于软件层面的多播技术容易导致路由延迟并加剧内存读写瓶颈等问题,本文考虑在路由器和交换机的内部交换结构中采用支持并发多

袁睿[7]2016年在《基于GPU的二维水动力学模型并行计算方法及应用研究》文中研究说明水动力学模型已广泛应用于溃坝洪水、通航水流条件计算等水流模拟相关领域。随着模拟任务与精度要求的不断增大,计算时间过长已成为影响模型应用的瓶颈。采用现代计算机技术,提高水动力学模型的计算效率是模型应用的迫切需求。本文对基于GPU的二维水动力学模型并行计算方法进行研究,以松花江胖头泡蓄滞洪区和长江上游重庆航道的水流计算为例,对并行模型的效率与关键影响因素进行探索,主要成果与结论如下:(1)研究了二维水动力学模型的求解方法,基于有限体积法建立了二维水动力学模型以适应研究区域水流复杂性。总结了OpenACC应用编程接口标准并行方法的原理与方法,阐述了OpenACC的并行标准与并行过程,对不同导语的并行实现进行了研究,测试了多功能子语在并行过程中的作用。基于OpenACC模式将二维水动力学串行计算模型改造为并行计算模型,对并行模型构建中数据环境控制、数据传输及效率优化等关键技术进行了研究分析。(2)将二维水动力学并行计算模型应用于长江上游江津至重庆航道水流的实时模拟,将模型计算结果与洪、中、枯三级实测流量瞬时水面线进行对比验证,并行模型能够较好的模拟不同水情下的通航水流条件。采用不同的网格精度,对比了并行模型的加速性能。由不同精度的计算结果可知,计算量越大时,并行模型的加速效果越明显。当网格数量为253161个时,通过数据传输优化获得了27.7的加速比。具体工程应用时,在二维水动力学并行计算模型计算基础上,建立了水流模拟结果的方案库,存储不同来流状况下的航道水流模拟结果,与并行计算模型相配合,进一步提高水流模拟的实时性。(3)将二维水动力学并行计算模型应用于松花江胖头泡蓄滞洪区溃堤水流模拟,通过划分4种不同精度的网格方案,对并行模型在Nvidia Kepler K20c显卡上进行了计算测试。测试结果表明并行模型在保证计算准确性的前提下,计算效率得到了很大的提升,获得了20.7倍的加速比。基于相同的计算任务,采用OpenMP和OpenACC两种并行方法进行了对比分析,总结了两种并行方法的实现特点、计算性能与适用情况。

雷州[8]1999年在《机群作业管理系统研究》文中研究指明计算机在50多年的发展中经历了五次重大的变革,大规模并行处理成为第五代计算机的最重要特征。机群系统以其卓越的性能价格比和良好的可扩展性等因素成为当今计算机体系结构与并行处理的发展方向,能够充分满足我们对计算机处理能力不断增长的需求,是当前的研究热点。 机群作业管理系统直接关系到机群性能的发挥和使用率的提高,是机群的一个重要组成部分。它能够充分利用机群的硬件软件资源及宝贵的CPU时间,有效地管理机群,合理调度作业,因此对机群作业管理系统的研究具有举足轻重的意义。 鉴于作业管理在机群系统中的重要地位,我们展开了对机群作业管理系统的研究。本文在总结前人工作的基础上,系统地研究了机群作业管理的关键问题,提出了机群作业调度的一种新的解决方案,最后就我们开发的基于曙光2000的作业管理系统进行了总结。主要工作包括: 1) 针对对机群作业管理系统的基本概念、组成、功能、特征等方面作了系统的概括。 2) 研究了几种MPP和机群系统上的作业管理系统,分析了它们的背景、基本结构、工作方式和功能特点,最后确立了作业管理系统的评判标准。 3) 从重要性的角度,设计与实现机群作业管理系统的关键问题可分为六个方面:可扩展性、负载平衡、检查点切取、进程迁移、作业调度及其它(资源管理、容错性、多用户特性等)。这几个方面既包括机群作业管理系统的重点,也包括难点。本文就当前它们的研究现状和解决方法进行了论述。

谢厚亮[9]2010年在《虚拟校园系统的设计与实现》文中提出本文以张家界航空工业职业技术学院为主设计了一个虚拟校园系统,提供了一个方便的浏览平台,让无法亲临的人们能够以最真实、真快捷的方式看到学院的风采。本文首先实现了VR校园的整体构造,然后结合地形、外观在合理利用空间的基础上获取所需设计样本,再使用VRML构造三维场景,完成VR校园的合成,实现用户与虚拟校园场景之间的交互。文章中详细地对虚拟校园系统做了分析,并在此基础上把系统模块化,以便系统地实现所有功能。本文还以几个有代表性的实例介绍了三维场景的创建思路,以及相关软件的使用。最后在系统实现中讨论了交互实现中常见的技术和方法,并对虚拟交互中的碰撞问题和优化问题做了详细探究。经系统运行测试,证明了虚拟校园系统的设计与实现项目完成了VR校园漫游系统应具备的大部分功能,能真实地再现校园的三维景观,用户可以在三维的VR校园中及建筑物内进行自由的漫游,并可以实现一系列真实感的交互操作。该系统的研究与实现有助于校园规划设计与管理,也为有关三维建模、虚拟场景、网上漫游、人机交互、VR小区及VR城市等方面的研究和应用起到示范、试验的作用。

郝瑜[10]2009年在《基于Web的三维造型的协同设计》文中指出随着Internet技术的不断发展和人们对CAD的需求,传统CAD技术越来越向网络化、协同化方向发展。本文针对这一趋势,利用课题组在协同设计方面已有的研发基础,并结合本课题组国家自然科学基金项目紫外光刻仿真的需要,进一步扩展与完善实验室所开发的基于Web的CAD系统,构建一个基于Web的同步协同设计环境。在这个虚拟平台上,来自不同区域的设计人员可以同时参与多个工程项目,实现对实体对象的同步显示与交互操作功能。它采用纯Java语言编写,具有很好的跨平台和多用户支持等特性。该系统由三部分组成:表示层,业务逻辑层和数据服务层。这种基于WEB模式的设计架构也帮助用户摆脱了安装客户端设计软件的麻烦,实现了随时随地参与设计,最大限度的满足了资源共享与信息交换的需求。为了便于系统实现三维造型功能,论文为二维系统构建了三维平台,实现了系统向三维领域的扩展,为基于光刻的MEMS加工分析准备了三维展示平台。论文首先进行系统架构与总体设计方面的介绍。然后为了设计的三维实体对象,在WebCAD系统上构建了三维平台,提供各种基本的造型工具。接着论文分析了三维平台的系统结构,提出了一套适合于本系统的多文档同步开发的方法并加以实现。为了实现复杂对象的快速生成,论文同时提出了协同布尔操作方法,可方便地通过对简单实体对象的布尔运算来得到复杂对象,并实现了对实体对象的三角面片化操作。文章的最后对所做的工作进行了总结,并对以后的工作提出了展望。

参考文献:

[1]. 二维Mesh网上消息传递软件的分析与实现[D]. 张浩. 中国科学院研究生院(计算技术研究所). 1995

[2]. 大规模并行计算机系统通讯问题研究[D]. 肖利民. 中国科学院研究生院(计算技术研究所). 1996

[3]. 机群高效通信系统研究[D]. 肖利民. 中国科学院研究生院(计算技术研究所). 1998

[4]. 机群高效通讯系统的研究与实践[D]. 孟丹. 中国科学院研究生院(计算技术研究所). 1998

[5]. Delaunay四面体剖分并行算法研究[D]. 霍吉东. 中国石油大学(华东). 2013

[6]. 多计算机互连网络上聚合通信算法的研究[D]. 刘刚. 中国科学技术大学. 2006

[7]. 基于GPU的二维水动力学模型并行计算方法及应用研究[D]. 袁睿. 华北电力大学(北京). 2016

[8]. 机群作业管理系统研究[D]. 雷州. 中国科学院研究生院(计算技术研究所). 1999

[9]. 虚拟校园系统的设计与实现[D]. 谢厚亮. 电子科技大学. 2010

[10]. 基于Web的三维造型的协同设计[D]. 郝瑜. 中国科学技术大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

二维Mesh网上消息传递软件的分析与实现
下载Doc文档

猜你喜欢