元计算环境对FORTRAN并行程序设计的支持

元计算环境对FORTRAN并行程序设计的支持

顾剑, 沈志宇[1]2002年在《jME元计算环境对Fortran并行程序设计的支持》文中认为介绍jME元计算环境对Fortran并行程序设计的支持。分析了Java和Fortran语言对元计算环境的支持及不足,然后论述了元计算环jMEFortran境支持并行程序设计的有关关键技术,包括保证同构性的措施、系统参数的获取、格式化输出和并行编程支持等。

顾剑[2]2002年在《元计算环境对FORTRAN并行程序设计的支持》文中进行了进一步梳理元计算(metacomputing)是基于网络的高性能计算技术,它通过网络连接强大的计算资源,形成对用户透明的超级计算环境,实现分布并行计算。元计算环境是在广域网上实现的,构成系统的计算机可以是不同种类、不同大小的,用户的程序类型也是多种多样的。因此,研究如何使元计算环境为更多的用户接受,使元计算环境在INTERNET上广泛应用具有非常重要的意义。 本课题的研究目标是实现jME元计算环境对FORTRAN并行程序设计的支持,实现用户管理功能,进一步完善元计算环境jME的各项功能,并使用户的程序能够安全、无错的运行于jME元计算环境。 本文分析比较了Java和FORTRAN两种程序设计语言的利弊,阐述了jME元计算环境支持FORTRAN并行程序设计的意义,并针对实现这种支持的保证工作机同构、并行编程支持、程序的分布执行、结果回收等几个关键问题做了详细阐述;然后就用户管理功能的实现做了讨论;最后在分析jME系统测试结果的基础上,对用户编程给出了一些建议。

佚名[3]2002年在《程序设计、程序框图》文中认为0220922iME 元计算环境对 Fortran 并行程序设计的支持[刊]/顾剑//计算机工程.—2002,28(6).—86~88(E)介绍 iME 元计算环境对 Fortran 并行程序设计的支持。分析了 Java 和 Fortran 语言对元计算环境的支持及不足,然后论述了 iME 元计算环境支持 Fortran并行程序设计的有关关键技术,包括保证同构性的措施,系统参数的获取、格式化输出和并行编程支持等。参60220923复杂全自动生产线的控制程序设计方法[刊]/刘一凡//电子质量.—2002,(3).—118~119(E)在大型复杂的全自动控制生产线中,由于系统的

张友良[4]2003年在《岩土大规模高性能并行有限元系统研究》文中研究指明本文的研究了如何在普通PC机群上实现岩土工程大规模有限元并行计算,以更好地发挥有限元在岩土工程中的应用。在PC机群COW并行系统上,实现大规模有限元并行计算需要解决有限元并行策略问题、大量数据的分布存储问题、大规模方程组迭代求解的收敛性问题和程序实现等。本文围绕如何解决以上问题提出了一套系统地解决这些问题的方法,具体来说做了以下工作,1、Windows环境下并行平台的组建。组建了用100Mbps高速以太网络联结若干台个人计算机的并行系统平台,在此平台上采用Windows下基于消息传递机制的MPI系统进行并行有限元程序开发。2、有限元并行策略研究。目前很多并行有限元采用的是局部并行算法,即对有限元计算中计算量大的部分实行并行,如单元分析、方程组求解等。对于分布式内存并行系统,这种方案需要大量通讯,大大影响计算速度,特别对于网络速度较慢的PC机群COW并行系统,这种方法的并行效率较低。本文提出采用区域分解的“分而治之”的并行策略实现有限元并行,即将有限元计算区域划分成若干大小相等的子区域,然后将这些子区域的计算映射到每个计算机上并行地进行。每个进程负责本子区域的有限元全部计算,只在区域公共部分进行通讯和交换数据信息。这种策略的优点在于高度并行、通信少、可扩展性好、程序具有很好的移植性,软件维护工作量也相对少。3、有限元计算数据的分布存储研究。由于大规模有限元数据量巨大,单个PC机求解一个主要问题是内存不足。解决数据分布存储问题就是实现超大规模有限元计算,同时还减少数据通讯。本文结合以上区域分解并行策略,将每个子区域的数据信息存储在相应的各个计算机上,实现存储局部化,大大减少并行计算中的通讯量,同时可以实现大规模计算。4、大型方程组并行迭代方法研究。由于直接法在存储量和计算量上的限制,不适合并行地求解大规模方程组,本文采用共轭梯度法来实现方程组的并行求解。为解决大型方程组收敛性问题,采用子区域信息建立预条件子。这种预处理技术非

张乐君[5]2008年在《基于网格的MPI并行程序运行框架的设计与实现》文中研究指明网格系统将地理上分散、系统上异构和动态变化的各种资源,通过互联网络连接起来,向用户提供可靠的、非集中管理的通用计算环境,在网格内进行并行程序的开发和运行是网格技术研究的一个重要方向。本文研究了网格环境内的多种MPI并行程序编程框架的优缺点,根据通信和多媒体领域内的并行计算任务的特点,提出和设计了一个新的基于网格的MPI并行程序设计和运行框架G-MPI。实现了网格中集群内节点和集群外节点间的有效通信;G-MPI加强了对并行任务的监控;设计的二次调度方案,对某些特殊任务在运行时出现异常的状况,能够节省大量计算时间;G-MPI库提供了C/C++编程接口,使得在高性能计算环境下用这两种语言开发的程序,不必经过改动,就可以移植到网格环境下运行;最后,对G-MPI的一些应用实例验证了这个新框架的有效性。

李晖[6]2009年在《高性能计算机若干关键问题研究》文中认为高速缓存一致性问题不仅关系着系统的正确性,还对系统的性能有着重要影响。多核处理器的高速缓存一致性协议设计更为复杂和验证更加困难。使用多核处理器构建大规模并行计算系统已经成为主流。在此环境下,高速缓存一致性协议需要处理的一致性事务更多,涉及到处理器芯片内多个高速缓存之间、处理器芯片内高速缓存与片外高速缓存之间、处理器芯片之间的一致性问题等。所以研究多核处理器的高速缓存一致性问题具有重要的学术意义和应用背景。首先,本文对多核处理器中的高速缓存一致性协议进行了研究,重点研究了扩放性较好、能适应多核处理器本身特点的MOESI协议及其实现,并对该协议做出了优化;其次,本文研究了在由多核处理器构建的并行计算系统环境下的高速缓存一致性协议,实验证明本文工作能够有效减少片内高速缓存失效次数(13%到30%)和提高系统性能(运行时间最多能减少30%左右);最后,本文研究了片上高速缓存的包含与非包含策略,提出了一个基于不包含策略的片上高速缓存系统设计,从而提高了片上高速缓存容量的利用率和提升了多核处理器的性能。高性能计算机是一个国家的重要战略资源,其国产化水平是一个国家综合国力的集中体现。目前采用我国具有完全自主知识产权的龙芯多核处理器构建高性能计算机已经被一些研究单位或机构纳入日程。首先,本文特别针对科学计算领域应用,对龙芯体系结构的多核处理器的片上缓存系统的性能进行了评测,指出了龙芯多核处理器在科学计算领域中的一些性能特点。其次,依此进行了一些设计空间上的探索。实验证明,在某些情况下可以使片上二级高速缓存命中率提高50%以上,等。高性能计算机的网络,对于机器的整体性能具有至关重要的作用。首先,本文研究了一种先进的新型网络拓朴结构:MPU,研究内容包括其数学模型、网络拓扑、路由算法等。其次,本文从理论上对MPU与当前其他先进高性能计算机网络进行了对比分析。最后,本文还介绍了为MPU所开发的一个大型并行模拟器MPUS的原理、架构、工作流程,等。实验证明,MPU的设计正确,且具有良好的可扩放性。KD-50-Ⅰ万亿次计算机是首台基于龙芯通用高性能处理器的国产万亿次计算机。首先,本文围绕KD-50-Ⅰ的体系结构设计,研究实现了KD-50-Ⅰ的无盘启动技术、构建了KD-50-Ⅰ的高效操作系统和文件系统、优化了KD-50-Ⅰ通信库,从而提高了系统的性能和可用性,有利于KD-50-Ⅰ的推广应用。其次,本文研究了实际物理学研究中常用到的扫描电子显微成像模拟程序在KD-50-Ⅰ上的应用,并对其进行了优化。本项工作提高了应用程序运行效率,为KD-50-Ⅰ在不同领域的应用提供了示例。

周小聪[7]2013年在《相变存储器电热分析有限元计算并行化》文中指出有限元方法作为一种非常有效的数值计算方法,被广泛应用到在计算机辅助工程分析。计算机并行软硬件技术的不断发展,为解决各种大规模工程分析问题提供了技术支撑,有限元计算方法的并行化研究已经成为重要的发展趋势。本文结合相变存储器有限元电热分析数值模拟的需要,在PC网络机群下对有限元方法的并行化算法以及实现技术进行了研究。研究了在有限元分析计算中占总时间比例很大的大规模稀疏矩阵方程组的并行求解问题,在充分研究总结现有的求解方程组的原理和方法的基础上,对求解方程组的迭代法之中的共轭梯度法及其预处理技术进行了深入的探讨。针对分布式存储并行系统,研究了其中涉及到的矩阵存储和负载均衡技术,以提高并行效率。深入了解了element-by-element(EBE)策略在有限元方法中的应用,通过分析EBE技术的基本原理,推导出一个基于Jacobi预处理的EBE-PCG并行算法。研究了该算法在分布式存储并行环境下的高效实现,在通信优化方面,针对传统算法中主节点中涉及到的大量数据交换可能影响到效率的问题,基于职责分离的思想设计专门的数据交换节点,以达到提高并行计算效率的目的。基于MPI并行编程模型,利用PC机在局域网内搭建了一个简单易用、可拓展性良好的集群并行环境。在此并行环境对上述算法进行测试、比较,同时基于EBE方法采用MPICH和Fortran语言编制了有限元并行计算程序,并把它应用到相变存储器有限元电热分析数值模拟中,取得了很好的效果。

裴科[8]2010年在《PRSoC叁层服务架构及其URAP协议研究》文中研究说明在半导体工艺技术发展、摩尔定律以及需求增长的多重驱动下,未来SoC/NoC的集成度和复杂性将继续增大。按照ITRS 2009年报告预测,到2020年单个芯片上的晶体管数目将达到100亿个。届时单个芯片上将集成数以千计的IP核,包括通用处理器GPP核、数字信号处理器DSP核、专用处理器ASIP核、算法组件核以及存储单元核等。在这样大规模的多核SoC设计中,各个IP核之间如何互联通信以及众多IP核资源如何管理和有效利用成为研究者们亟待解决的重要课题。因此,未来多核SoC必须从总线体系结构和IP服务架构上进行创新性设计,才能够从根本上解决高性能、低功耗、并行性和可扩展性强的片上通信系统的诸多瓶颈问题。这已经成为近年来学术界和产业界研究的热点领域。坚持“今天的PC世界,就是明天的SoC空间”的理念,将PC世界的应用软件、操作系统、通信协议和算法等极大化地嵌入到下一代多核SoC(NoC)中。把面向服务体系结构(SOA)引入到异构嵌入式多资源结点及多核处理器系统设计中,尝试在多核SoC硬件模型上建立面向服务的语义描述,开拓一种非传统操作系统概念的多元资源SoC的资源管理方法。在上述研究背景下,本文主要在以下叁个方面对未来多核SoC的总线架构、片上通信和资源管理问题进行了探索性研究:(一)针对嵌入式系统SoC资源和应用领域多元化的趋势,提出了多元资源嵌入式系统(PRES)和多元资源片上系统(PRSoC)的概念;借鉴互联网的思想,从总线架构的角度对未来单硅片内拥有成千上万个IP核资源的SoC/NoC进行模型设计,为从体系结构上彻底解决片上通信的瓶颈问题,将网络技术应用到芯片设计中;提出了基于NoC、采用一种非对称片内单向串行只写总线(OWOCSB)互联多元资源结点的PRSoC硬件模型,并在该模型中实现了8051单片机IP核、硬盘控制器IP核和以太网控制器IP核等;利用Mesh网络拓扑结构实现多资源结点的深度互联扩展,形成一个具有多元资源结点架构的多元资源结点网络(PRNN)模型;(二)提出并设计了一种基于PRSoC硬件模型的资源访问协议——统一资源访问协议(URAP),为具有多元资源结点架构的SoC应用程序提供统一的接口和规范,使得用户可以透明的访问到PRSoC系统中所有末梢资源结点,完成对系统中混杂资源的统一管理;通过对PRSoC中各类资源结点进行应用角色和操作功能划分,提出了一种基于URAP的面向角色资源管理框架(RO-RMF)。(叁)在PRSoC硬件模型中的主资源结点和从资源结点间建立了基于URAP和RO-RMF的语义层模型,形成了“需求—语义—实现”的片内叁层服务架构;并采用UML构建了基于PRSoC叁层服务架构的文件系统模型和基于MPI硬件加速模块并行算法模型实例。最后,设计实现了一套集多个异构处理器和多种外设资源于单板的PRSoC板级原型机系统。

程汤培[9]2011年在《地下水流动数值模拟的高效并行计算研究》文中研究指明地下水并行数值模拟的研究对于环境水文地质和工程地质问题具有十分重要的现实意义。随着研究的深入,其对具有精细网格剖分、长时间跨度特征模型的模拟提出了迫切需求。但传统的串行模拟方法由于在处理器、内存以及数据通道上的限制,极大的制约了其应用范畴,从而使得提出一套支持大规模地下水数值模拟的计算方法成为了十分重要和迫切的科学问题。本文的主要工作围绕着地下水流动数值模拟的并行计算展开。论文的研究重点定位于如何借助并行计算科学领域中大规模偏微分方程组并行求解的相关理论,结合先进并行体系结构的一些最新研究成果,来解决地下水流动模型离散形成的线性系统求解中的性能瓶颈问题。围绕着研究对象,本文的主要贡献如下:(1)深入分析了地下水流动模拟计算任务的并行性,并针对几类常见并行体系结构,给出了其主体计算任务与体系结构各级之间的合理映射策略,为相应的体系结构下设计高效的算法结构、支持结构以及实现策略的提供了理论参考依据。实验证明,在分布式内存系统上的粗粒度数据并行策略,以及在共享内存系统和GPU-CPU上细粒度的线程级并行策略具有良好的计算性能。(2)面向地下水流动数值模拟问题,给出了预处理方法的选取与构造方案,以及预条件子与迭代方法的最优组合。在分布式内存系统上,提出了多种预条件子技术相结合的构造方案。区域之间采用了分块迭代算法,而区域内部子预条件子的构造则采用了不完全分解方法。实验证明,BJacobi与ILU(0)预条件子的组合具有最优的计算性能、最小的内存开销以及良好的可扩展性。在GPU-CPU系统上,提出了Jacobi预条件子与CG算法的求解组合。实验证明,该组合具有较好的平衡预条件子的构造代价与其加速收敛的效果。(3)提出了一套稀疏系数矩阵的组装算法,给出了MODFLOW与通用并行迭代求解器的接口设计方案。实验证明,采用CSR格式进行矩阵数据的传输,有效降低了CPU与GPU间的通信负载;基于BCRS分块算法的稀疏矩阵-向量乘操作,提高了GPU寄存器的利用率。论文的其它重要工作包括:初步提出了一套基于结构化分层设计、具有良好扩展性的地下水并行数值模拟支撑平台;给出了一套大规模叁维流场模型数据的前后处理方案等。

钟敏[10]2014年在《地震资料处理应用网格平台构建研究及应用》文中进行了进一步梳理在地震勘探领域,随着地震勘探新技术的发展和应用,地震资料采集的数据量和处理的计算量也在快速增长。为了充分利用行业已有丰富的高性能资源,进一步扩大地震资料并行处理规模,本文以地震资料迭前偏移处理为典型应用,研究利用网格技术建设地震资料分布式并行处理平台所面临的广域分布、异构高性能资源的共享与协同、分布并行任务调度及分布数据管理等关键问题。在分析地震资料数据特征和各处理流程计算特征的基础上,重点分析了共炮点道集波动方程迭前深度偏移应用粗粒度可分特征。围绕地震资料分布并行处理中关于资源监控与选择、任务划分与调度、作业的监控管理以及分布数据管理等问题,提出了基于Globus Toolkit4分布式基础设施的地震资料处理应用网格平台体系结构,并对基于Globus标准的平台服务实现机制与并行消息传递机制进行了研究。研究了地震资料并行处理任务对网格多资源优选问题及其支撑服务网格资源监控服务的实现机制。结合网格资源性能属性建立了离散型多目标规划数学模型,采用评价函数法将问题转化为单目标优化问题,并在此基础上采用遗传算法解决了多资源优选的全局优化问题。基于MDS组件设计并实现了应用网格平台资源监控系统,为资源选择和用户管理资源提供了支持。结合地震资料粗粒度可分任务特征,提出了叁层网格调度模型,设计了基于GT4的作业调度与管理框架,通过应用调度器实现了粗粒度可分任务的数据自适应划分、调度和自动并行处理。基于可分负载理论提出了带探测的粗粒度可分任务划分(PDP)策略,Marmousi模型Fourier有限差分迭前深度偏移PDP自适应并行调度处理结果表明在给定资源集合的前提下,算法能够使任务完成时间跨度达到最优。基于Globus数据管理相关组件构建了面向地震资料处理的分布数据管理框架,设计了可扩展的应用元数据模型和数据索引元数据模型。在此基础上设计并实现了应用网格平台高级数据管理服务(包括数据复制服务、数据定位服务和数据删除服务)和基于Web的数据管理Portal,实现了分布数据的高效访问与管理,为网格并行任务的执行和用户管理网格数据提供了有力支持。在实际生产环境中部署了应用网格平台,将Kirchoff积分法迭前时间偏移应用移植到网格平台,对实际生产数据进行了处理,验证了平台的正确性、稳定性和效率。应用网格平台的优势在于能够实现分布、异构高性能资源之间的协同计算,为有效整合行业积累的丰富高性能资源,进一步扩大地震资料并行处理规模,提高现有高性能资源的利用率提供了新的思路。

参考文献:

[1]. jME元计算环境对Fortran并行程序设计的支持[J]. 顾剑, 沈志宇. 计算机工程. 2002

[2]. 元计算环境对FORTRAN并行程序设计的支持[D]. 顾剑. 国防科学技术大学. 2002

[3]. 程序设计、程序框图[J]. 佚名. 电子科技文摘. 2002

[4]. 岩土大规模高性能并行有限元系统研究[D]. 张友良. 中国科学院研究生院(武汉岩土力学研究所). 2003

[5]. 基于网格的MPI并行程序运行框架的设计与实现[D]. 张乐君. 北京邮电大学. 2008

[6]. 高性能计算机若干关键问题研究[D]. 李晖. 中国科学技术大学. 2009

[7]. 相变存储器电热分析有限元计算并行化[D]. 周小聪. 华中科技大学. 2013

[8]. PRSoC叁层服务架构及其URAP协议研究[D]. 裴科. 太原理工大学. 2010

[9]. 地下水流动数值模拟的高效并行计算研究[D]. 程汤培. 中国地质大学(北京). 2011

[10]. 地震资料处理应用网格平台构建研究及应用[D]. 钟敏. 中国石油大学(华东). 2014

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

元计算环境对FORTRAN并行程序设计的支持
下载Doc文档

猜你喜欢