数值线性代数中的若干问题

数值线性代数中的若干问题

朱琳[1]2017年在《基于发生教学法的线性空间概念的教学研究》文中指出线性代数是大学本科最基础性的一门重要课程,在生物化学、计算机技术、经济学、医学等其它领域有着广泛的应用。与其它课程不同,线性代数中充斥着大量的定义、定理、证明,学生往往还没有充分理解好一个概念,新的概念和定义、定理纷至沓来。然而,很多学生表示,即使不理解概念,也能套用运算和证明的框架来进行解题。因此,理解学生在概念学习中遭遇的困难,并以此改进教学策略,在线性代数的教学研究中显得尤为重要。线性代数的主要研究对象是线性空间及其上的线性变换,可以说,线性空间是线性代数中的核心内容。在通常的教学中,线性空间的概念以形式化的抽象语言呈现,为学生的学习带来很大困难。本研究重点关注线性空间概念的教学,试图探究学生对线性空间概念的理解,揭示学生学习时的困难,并以此来指导教学策略的设计,旨在不同情境下都能让学生建构起对线性空间及其相关概念的理解。本研究的研究问题为:(1)学生是如何理解线性空间概念的?学生在理解线性空间概念的过程中,会遭遇哪些困难?(2)发生教学法指导下的线性空间概念教学是怎样的?是否能有效促进学生对线性空间概念的理解?本研究首先在文献研究、专家访谈和学生问卷调查的基础上,构建了初始的研究模型,包括分析学生概念理解的发生演变模型和概念认知模型,以及发生教学法指导下的教学设计模型。然后,研究者对沪上一所教育部直属985高校的大学生进行了两个学期的教学实践,按照分析与准备、设计与实施、结果与评价、反思与修正四个部分展开,通过问卷调查、质性访谈、课堂观察等方法,对初始模型进行验证和修正,形成研究成果。本研究的结论为:(1)绝大部分学生属于概念意象和概念定义的弱关联型;仅有少部分学生能够达到"对象"和"图式"的心理认知阶段;学生对概念的理解容易受到叁维空间的限制、容易受到旧有认知的干扰。(2)学生在学习抽象的线性空间概念时,容易遭遇包括抽象的困难、直觉的迷失、对术语理解的困难和概念之间缺乏关联的困难。(3)发生教学法下指导下的教学,可以基于历史发生分析、知识逻辑分析、心理认知分析、社会文化分析四种视角分析的基础,按照必要性、直观性、关联性、应用性、系统性五个原则进行设计,依照why-what-how to learn-how to use(简称WWHH)四个步骤进行教学。(4)发生教学法的教学实践下,可以丰富学生的概念意象,使得学优生完成从程序到对象、图式阶段的提升,实现从概念定义和概念意象的弱关联到灵活转换型的转变:中等生实现从行动阶段到程序阶段的转变;学差生实现从概念定义和概念意象的分离型向弱关联型的提升,有效促进了学生对线性空间概念的理解。本研究的价值在于,首先,关注具体的数学概念学习过程,利用APOS的发生演变理论、概念意象和概念定义、概念图理论,在实证的基础上多方面、多角度地对学生概念的理解水平、对概念理解的发展变化予以描述和分析。其二,在发生教学法的理论指导下,构建了适合于本土国情、适合于大学生认知特点、适合线性代数教学的教学设计实施模型。不仅可以研究学生的学,还可以指导教师的教,具有理论意义和实践意义。

王少帆[2]2010年在《分片代数曲线与离散Willmore问题研究》文中研究说明分片代数曲线定义为二元样条函数零点的集合.分片代数曲线不仅有其特有的代数几何方面的性质,而且与二元样条的插值问题,计算机辅助设计中的几何造型,图论中的四色猜想命题及传统代数几何的问题有密切联系.本文针对分片代数曲线与传统代数曲线本质上不同的性质,以及分片代数曲线在二元样条插值问题上的应用进行研究.考虑的问题包括:任意叁角剖分上分片线性代数曲线的Bezout型定理,贯穿叁角剖分上零阶分片代数曲线的Cayley-Bacharach定理,沿分片线性代数曲线的插值适定点组的性质及其在零阶二元样条函数插值问题上的应用,叁角网格上离散曲率的计算公式及Willmore问题的离散格式.本文的主要工作如下:1.分片代数曲线的Bezout数定义为两条交点有限的分片代数曲线的最大交点个数.我们利用奇圈上分片线性代数曲线的交点性质,给出了仅含一个奇内网点v的叁角剖分上分片线性代数曲线的Bezout数的上界,即叁角剖分的胞腔数与奇内网点v到剖分边界的(图论意义下的)距离的差:T-dist(v,(?)Δ).并且,当仅含一个奇内网点的叁角剖分满足某一项点染色条件时,我们计算了该剖分上分片线性代数曲线的Bezout数,其值等于T-dist(v,(?)Δ).此外,我们引入叁角剖分的奇圈覆盖数的概念,计算了任意叁角剖分的奇圈覆盖数的表达式,由此得到任意叁角剖分上的分片线性代数曲线的Bezout数的上界.这一结果表明,含奇内网点的叁角剖分上分片线性代数曲线的Bezout数与叁角剖分的奇内网点之间的距离以及奇内网点到剖分边界的距离有关.2.代数几何中的Cayley-Bacharach定理研究平面上给定点集在给定次数的多项式空间上的独立条件的个数.其常见形式为:若m次代数曲线与n次代数曲线恰有mn个不同交点,则任何通过这些交点中的mn-1个点的m+n-3次代数曲线亦过余下的一点.我们指出,若贯穿叁角剖分上m次0阶分片代数曲线与n次0阶分片代数曲线恰有mnT个不同交点,则任何通过这些交点中的mnT-1个点的m+n-2次分片代数曲线亦过余下的一点.并且,如果余下的一点所在的胞腔以△的两条或叁条内网线为边,则满足上述条件的分片代数曲线的次数为m+n-1或m+n.此外,我们研究了沿分片代数曲线的插值点组(所谓沿分片代数曲线的插值点组,是一类位于给定的分片代数曲线上的点集,它与任何低次样条空间的插值点组的并集构成高次样条空间的插值点组,只要低次样条空间的插值点组的任何点不落在给定的分片代数曲线上)的性质并将其应用于二元样条插值问题.我们指出,星形域上沿分片线性代数曲线的k次0阶样条空间的插值点组在星形域各个胞腔的点数满足交错分布的性质.借助这一性质,我们给出了任意叁角剖分上k次0阶样条函数空间的插值点组的新的构造方法.与传统的B网方法相比,此方法只依赖于点集在各个胞腔落在给定分片代数曲线上的点数,而与点集的几何位置无关.3.微分几何中的Willmore问题是在R3曲面的某个允许集中寻找曲面,使得其平均曲率平方的积分最小.从计算叁角网格上顶点的平均曲率出发,我们首先给出了传统的两类平均曲率公式:余切和公式及二次拟合公式的收敛性质.利用余切和公式的误差函数分析,我们给出了一类新的计算平均曲率的公式,它由1邻域顶点的余切和公式的加权平均得到.渐近分析和数值实验均表明,该公式对计算叁角网格上顶点的平均曲率具有很好的收敛性.并且,我们给出了基于二次拟合法的离散平均曲率的数值积分作为离散Willmore能.分析表明,若网格满足二次适定条件,离散Willmore能收敛于曲面的Willmore能;若网格的离散单位法向具有叁次收敛阶,则离散能量泛函的极小元收敛于曲面的Willmore能的极小元.由此可以建立基于该能量泛函的Willmore问题曲面形变的数值模拟.

李政[3]2017年在《精细油藏数值模拟中的高效求解器研究》文中研究说明随着复杂类型油藏(低渗、高含水、复杂岩性油藏等)开发的日益深入和提高采收率技术的推广使用,油藏数值模拟所依据的数学模型变得越来越复杂,同时油藏地质模型趋向精细化、网格复杂化、井数增加以及类型多样化等,这些因素导致渗流模型数值离散所形成的雅克比线性代数方程组的规模大、性态坏。在全隐式油藏数值模拟计算中,雅克比线性代数方程组的求解是一个主要瓶颈,其求解时间往往占据整个模拟计算时间的70%~80%,而且随着问题规模增大,该比重会进一步提高。设计高效的数值求解算法来提高雅克比线性代数方程组的求解速度是缩短数值模拟时间最有效的途径之一。另外当前计算机的硬件架构越来越异构化,利用众核处理器(如GPU、MIC)来协助CPU计算的解决方案在科学计算领域正释放巨大的能量,并掀起一股新的高性能异构并行计算浪潮。本文针对经典标准黑油模型,为其全隐式离散得到的雅克比线性代数方程组设计高效的串、并行求解算法。首先,针对黑油模型的强耦合雅克比离散代数方程组,我们分析几种常用解耦方法,如交错块分解解耦、拟隐压显饱解耦、隐压显饱解耦,并分别考察这几种方法的解耦效果以及对压力方程椭圆性的影响。我们发现:交错块分解解耦方法能很好地削弱压力变量和饱和度变量以及饱和度变量和饱和度变量之间的耦合关系,同时对雅克比矩阵的特征值有很好的聚集作用,但该方法破坏了压力方程的椭圆性,使压力方程求解难度增加;拟隐压显饱解耦和隐压显饱解耦方法借助IMPES方法的思想,通过代数方法得到一个椭圆性较好的压力方程,但该解耦方法只削弱了压力方程中压力变量与饱和度变量的耦合程度。针对上述叁种解耦方法得到的压力方程,本文分别比较了经典AMG方法、VMB聚集AMG方法以及Pairwise聚集AMG方法的求解速度,并简单分析上述叁种AMG方法在求解经不同解耦方法得到的压力方程时收敛速度差异大的原因。经上述分析,我们将隐压显饱解耦方法与经典CPR预条件子结合起来形成一类分裂型预条件子,并用Pairwise聚集AMG方法取代经典AMG方法来求解压力方程,此分裂型预条件子的求解速度较交错块分解解耦方法与经典CPR预条件子组成的分裂型预条件子快了近50%。其次,由于当前油藏模拟向精细化发展,雅克比矩阵规模突破千万量级且性态越趋病态,给雅克比线性代数方程组的求解带来了极大困难,研发针对精细油藏模拟带来的超大规模雅克比线性代数系统的高效、稳健求解算法是十分必要的。本文利用交错块分解解耦方法具有聚集雅克比矩阵特征值以及削弱物理变量间耦合关系的性质,基于辅助空间校正思想,提出了一种稳健、高效、节省内存的分裂型预条件子。该分裂型预条件子采用交错块分解解耦方法作为左预条件子,然后针对交错块分解方法解耦后的雅克比矩阵的性质,设计了一种多阶段辅助子空间右预条件子BASP:首先在饱和度子空间用块高斯赛德尔方法对饱和度方程进行一次近似求解,消除饱和度部分的高频误差部分;其次针对带强间断系数的椭圆型压力方程,我们采用AMG预条件Krylov方法来近似求解达到一定精度,消除由压力方程控制的低频误差;最后在全空间做一次块高斯赛德尔磨光。通过大量油田实例测试,该分裂型预条件子整体表现得十分高效及稳健。基于该预条件子的模拟器的求解速度比国际主流商业模拟器快2到3倍,且在台式工作站上成功模拟了千万网格规模的精细油藏模型。最后,本文基于CPU-GPU异构体系设计一种求解雅克比线性代数方程组的高效并行线性解法器。当前超级计算机的计算能力越来越强大,但体系结构日趋复杂,大多数采用多核、众核处理器、大型高速缓存、高带宽进程间通信结构和高速I/O功能的设计模式。如何构建现代化高性能应用软件来充分利用计算机的异构架构特点和资源是十分值得探索的。本文针对油藏模拟中的雅克比矩阵的结构特点,提出了一种适合GPU访存特点的BHYB的稀疏存储格式,基于该格式的SpMV的加速比最高达19倍,比世界着名的Nvidia公司研发的高效CuSparse软件包最快的HYB格式快30%;其次基于GPU的SIMT编程模拟,本文提出了一种双密集型并行策略,设计了一种并行度高、并行可扩展性好的BILU(l)方法,其中BILU(0)分解阶段和叁角求解阶段的平均加速比分别达到6.27倍和9.46倍;最后结合计算机的异构特点以及AMG算法各部分的可并行度,设计了一种异构并行UA AMG方法,且该并行UA AMG方法没有损失串行UA AMG方法的收敛速度。通过整合上述并行模块,我们形成了一种基于CPU-GPU异构体系的并行BCPRP预条件子。数值试验表明该并行预条件子十分稳健,相比改进后的串行BCPRP预条件算法,该并行BCPRP预条件子在单GPU卡上的求解速度提高了 3.0倍左右。此外,基于"天河二号"超级计算机,我们研发了一套分布式并行求解算法,将模拟规模扩展到亿量级网格单元的同时,也极大提高了油藏模拟效率。该分布式并行求解器在千核以内都具有良好的可扩展性,但扩展到10,008个CPU物理核心后,分布式并行求解器的强可扩展性还不够理想,线性求解器算法还有待进一步优化。

徐小文[4]2007年在《可扩展并行代数多重网格算法研究》文中进行了进一步梳理随着高性能计算机系统的日益普及和性能的大幅度提升,复杂物理系统的精细数值模拟成为可能。此时,偏微分方程组隐式离散后,通常需要求解大规模稀疏线性代数方程组。当前,迭代法是求解该类方程组唯一可行的方法。但是,由于物理系统的复杂性和系数矩阵的大规模,普通的迭代方法难以适应。这种不适应主要表现在两个方面:第一,迭代法不具备良好的算法可扩展能力,即算法的收敛迭代次数严重地依赖于系数矩阵的规模和性质;第二,迭代法不具备良好的并行可扩展能力,即单次迭代的并行效率低。一个高效的并行迭代法,应该同时具备良好的算法可扩展能力和并行可扩展能力。因此,针对复杂物理系统,设计适应数百乃至数千甚至数万个处理器的高效迭代法是当前高性能科学计算的一个前沿课题,具有重要意义。代数多重网格方法(AMG)是具备良好算法可扩展性能的一类迭代法,在复杂物理系统的串行数值模拟中得到广泛应用。在AMG算法中,网格粗化策略是影响算法可扩展能力的重要因素,一个最优的粗化策略应该具有尽可能低的算子复杂度,并保持良好的迭代收敛性质。遗憾的是,这种策略通常是内在串行的,不具备并行度。因此,长期以来,网格粗化策略的串行本性一直是阻碍其应用于大规模并行计算的关键因素。近年来,大量的研究工作通过牺牲算法可扩展能力获取并行度,提出了一系列并行粗化策略,力争在算法可扩展能力和并行可扩展能力之间寻求最佳的权衡点,以便AMG算法适应大规模并行计算。本文围绕这一前沿课题开展研究,具有重要的理论和实际应用价值。本文的主要贡献如下:1.针对迭代法,发展了一套具有普适性的、衡量算法可扩展能力和并行可扩展能力的分析方法。该方法从算法可扩展和并行可扩展的两个角度,衡量它们对并行计算时间的贡献。如果固定每个处理器的计算规模,增加处理器个数时,相对于单机情形的执行时间,并行计算时间将被放大。此时,算法可扩展能力和并行可扩展能力可分别由各自对放大倍数的贡献因子来定量描述。运用该方法,本文剖析了并行AMG算法的性能瓶颈,获得了若干有启示性的结论,明确了课题的研究方向。2.提出了两个松弛型并行粗化策略:RRS和RCLJP。它们是当前保持良好算法可扩展能力的前提下,在数百个处理器上,获得最佳并行迭代性能的并行粗化策略。该类策略的主要思想是:针对完全并行的RSO和CLJP策略严重破坏算法可扩展能力的缺陷,通过设置同步条件并在同步时交换拟边界层网格粗化信息,各个处理器协同地完成并行粗化。3.基于稀疏线性代数方程组中未知量之间依赖关系的强弱程度,从代数角度,提出单尺度矩阵和多尺度矩阵的概念,并根据这些概念,提出网格结块技术。该技术基于图搜索算法,将网格划分成互不重迭的若干单尺度块。在每块的内部,未知量之间的依赖程度是近似相同的,于是,高度并行的粗化策略和简单的点松弛光滑算子可以直接运用,它们不会降低算法可扩展能力。但是,块的边界是单尺度向多尺度的过渡区域,其中称之为代数界面的子区域,需要认真对待。多尺度矩阵概念和网格结块技术为并行AMG算法的设计提供了新的启示性思路。4.针对多尺度稀疏线性代数方程组,基于网格结块技术,提出了两类AMG算法:小尺度优先松弛和粗化的AMG算法(SPRC-AMG),以及界面优先松弛和粗化的AMG算法(IPRC-AMG)。前者通过不断地粗化小尺度块内的网格结点,配合块内的点松弛,逐步消除或消弱矩阵的多尺度性,使得所构造的粗网格方程组易于求解;后者认为代数界面决定AMG算法的收敛性质,因此,首先应该粗化代数界面的网格点,然后粗化单尺度块内的网格点,从而在保持低算子复杂度的前提下,获得良好的收敛因子。对于SPRC-AMG算法,在对称正定的情形下,本文给出了收敛性证明,并估计了收敛因子。5.将界面优先粗化的启示性思想应用于松弛型并行粗化中,得到了界面优先松弛型并行粗化策略(RIPC)。该策略视界面优先粗化为松弛型并行粗化中的同步条件,需要分别在界面和非界面区域执行并行粗化。更进一步,采用当前国际上最具并行可扩展能力的PMIS方法,可得到RIPC-PMIS并行粗化策略。基于该策略的并行AMG算法继承了PMIS的低算子复杂度和高并行度,同时,保持了IPCR良好的收敛性质,是一个高效的并行粗化策略。百个处理器上的并行数值实验验证了算法的有效性。6.针对二维叁温能量方程,提出了基于物理量的网格粗化策略和一个两层迭代算法。该算法基于物理量粗化策略和相应的C/F块松弛光滑算子,将求解叁个温度耦合的稀疏线性代数方程组化为若干个单温方程组的求解。在此基础上,将IPRC-AMG算法应用于求解这些单温方程组。模型问题和实际应用问题的数值实验均表明了两层迭代算法和IRPC-AMG算法的有效性。

王金铭[5]2006年在《工程电磁场耦合问题分析的若干数值技术研究》文中研究表明许多复杂的工程问题,例如叁维涡流场问题、磁场与流场耦合场问题,其数学模型均可表示为偏微分方程组的定解问题。这些偏微分方程组往往是非定常、非线性的,其数值求解不仅计算规模庞大,而且涉及到许多方面的数值技术,目前已成为国内外研究者关注的热点和难点。 本文以叁维涡流场问题、磁场与流场耦合问题为例,对工程电磁场耦合问题分析中的若干数值技术进行了较深入的研究,具体内容如下: 叁维涡流场问题是许多工程电磁场耦合问题的重要组成部分,在求其数值解时,线性代数方程组求解往往占据了整个计算所需要的大部分计算时间。本文针对叁维涡流场问题分析中所形成的大型稀疏对称病态线性代数方程组,提出了两种改进型预处理共轭梯度法。其一在系数矩阵是对称正定的前提下,从减少共轭梯度法每一次迭代的计算量出发,提出了求解线性方程组的带有控制参数的改进型预处理共轭梯度法(PICCG1法),理论分析与实际计算表明PICCG1法的收敛速度与常规的ICCG法非常接近,而计算时间比ICCG法减少30%以上;其二在系数矩阵是对称非正定的前提下,从减少共轭梯度法的迭代次数出发,提出了求解线性方程组的带有控制参数的改进型预处理共轭梯度法PICCG2,理论分析与实际计算表明PICCG2法的迭代次数与常规的ICCG法相比明显减少,计算时间比ICCG法减少60%左右。 磁场与流场耦合问题不仅具有复杂的空间分布和时间变化,而且具有运动的介质,这类问题的数值技术正处在探索与发展阶段。本文针对磁场与流场耦合问题,提出了一种直接耦合解法并进行了仿真计算,具体包括以下五个方面:其一以磁流体动力学方程为依据,使用人工非定常化方法,进行适当的简化假设,得到了磁场与流场直接耦合问题的一种实用的定解问题,并将其用于电磁离心铸造等过程中的仿真计算中;其二在环形求解区域内,对上述定解问题中的时间变量使用向后差分法、空间变量使用有限体积法进行离散化得到相应离散化格式,并将其应用于实例计算中;第叁用牛顿—拉夫逊方法求解上述离散化方程组,形成相应的迭代格式,并进行局部收敛条件分析;第四针对上述迭代格式为非对称、循环块叁对角线性方程组,提出了一种带有控制参数的改进型直接叁角分解法,并通过实际计算加以验证;最后以电磁离心铸造OCr17Mn14Mo2N

邬贵明[6]2011年在《FPGA矩阵计算并行算法与结构》文中研究说明可重构计算是一种基于定制硬件实现的计算形式,现场可编程门阵列(FPGA)便是典型的可重构计算平台。近年来,FPGA芯片集成了越来越多的硬件资源,提供了强大的计算能力,可重构计算领域已渐渐步入可重构超级计算的时代。矩阵计算是科学和工程应用的核心问题,FPGA可重构计算系统在加速矩阵计算方面具有巨大的潜力。然而,FPGA实现矩阵计算还面临着硬件编程、并行算法设计、硬件结构优化等挑战,已有的矩阵计算硬件结构占用了大量FPGA资源、存储需求太高、带宽需求过大,可扩展性也很差。为应对这些问题和挑战,本文对矩阵计算的FPGA实现技术进行了深入的研究。本文的主要工作和创新点如下:(1)提出了面向基本矩阵运算的FPGA设计方法和高性能、高存储效率分块矩阵乘并行结构。以矩阵向量乘和矩阵乘为例,研究了矩阵计算FPGA实现技术中的时空映射和模型构建方法,实验评测验证了这两种基本矩阵运算并行结构的自动生成框架。利用包括循环分块在内的一系列变换和优化,推导出数据传输优化、存储优化的分块矩阵乘并行算法,得到了一种能够处理任意数据规模矩阵的高性能、高存储效率的矩阵乘并行结构。实验结果表明该并行结构优于相关工作,且存储需求从O(b2)降到了O(b),b为数据块大小。(2)提出了FPGA列选主元LU分解细粒度流水线并行算法和实现该算法的线性阵列。提出的并行算法能够充分开发LU分解中的流水线并行和数据重用,可以扩展到下叁角方程组求解和多右端项的线性方程组求解问题。本文提出了FPGA全硬件实现稠密线性方程组求解的并行结构,结构的核心是实现该并行算法的线性阵列,线性阵列可以同时实现列选主元LU分解和下叁角方程组求解。本文还给出了该并行结构的性能模型,从而可以更好地分析和预测其性能。实验结果表明该并行结构优于相关工作和通用处理器的软件实现。(3)提出了FPGA分块稠密矩阵分解的并行算法和并行结构。以不选主元LU分解为例,提出了一种分而治之的稠密矩阵分解分块策略和FPGA实现方法。该策略对串行LU分解应用包括循环分块、时空映射在内的一系列变换,推导出能够处理任意规模矩阵的分块LU分解并行算法。主要思想是把LU分解算法分解成细粒度计算任务,细粒度任务能够直接映射到FPGA实现的线性阵列,这些任务按照正确的顺序在线性阵列上执行。提出了实现该算法的高性能、高存储效率分块LU分解并行结构。与需要两组线性阵列的结构相比,该结构仅需要一组线性阵列,且存储需求从O(b2)降到了O(b),b为数据块大小。本文还把该分块策略和实现方法扩展到了多FPGA系统,并应用到Cholesky分解。实验结果表明,提出的并行结构计算效率高于通用处理器。(4)提出了两种稀疏矩阵LU分解并行算法和实现这些算法的并行结构。稀疏矩阵LU分解的数值计算是直接法求解稀疏线性方程组过程中最耗时的一部分,本文提出了两种稀疏矩阵LU分解并行算法:Right-Looking (RL) LU分解并行算法和Left-Looking (LL) LU分解并行算法。前者能够通过开发分解因子的数据重用来减少数据传输,后者能够通过动态相关性检测来开发更多的并行性;两种算法对应的并行结构都能够动态生成分解因子的数据结构。实验结果表明,LL LU分解的并行结构的性能优于RL LU分解的并行结构和通用处理器的软件实现。(5)提出了新颖的稀疏矩阵向量乘(SpMV)并行结构和共轭梯度法(CG)并行结构。迭代法的计算量往往都集中在处理SpMV,本文对SpMV并行结构进行了深入的研究,并应用到了CG的FPGA实现。提出了一种适合于FPGA设计的稀疏矩阵分块方法和存储格式,基于该存储格式的SpMV并行结构可以有效处理任意大型稀疏矩阵。与相关工作相比,本文提出的两种高效的SpMV并行结构无需改变任何设计参数便可以处理任意矩阵,其中一种结构可以有效减少零的填充。实验结果表明,提出的SpMV并行结构的性能优于相关工作和通用处理器的软件实现;提出的CG并行结构的性能也优于通用处理器的软件实现。

任小广[7]2014年在《面向CFD并行应用框架的容错技术研究》文中指出器件工艺的发展和并行规模的不断扩大,使得高性能计算机性能不断得到提升,但也带来编程墙和可靠性墙的严峻挑战,严重制约了高性能计算机应用的发展。对于编程墙问题,研究者们提出了面向领域的并行应用框架,实现了各学科专家在并行领域应用开发过程中的解耦,大幅度提高了并行领域应用的开发效率。而可靠性问题也一直是并行应用研究的热点问题,已有众多相关容错理论研究,但都不够透彻。传统基于硬件的容错方法面临着容错代价大、缺乏灵活性等诸多问题;而在实现层面上,系统级容错虽然面向用户透明,但存在着开销过大的问题;应用级容错虽然一定程度上缓解了容错开销问题,却使得用户负担加重。本文首次对面向CFD(Computational Fluid Dynamics)并行应用框架的容错方法展开研究。应用框架下容错能够在实现向上层用户透明的同时,保持应用级容错方法的低开销优点。并且在CFD并行应用框架内,能够将容错设计和实现与CFD并行应用特点进行有效结合,获得更为高效的容错优化方法。因此,研究CFD并行应用框架下的容错技术对促进CFD并行应用发展有着重要意义。本文在现有CFD并行应用软件框架的基础上,研究了面向CFD并行应用软件框架的容错技术。我们设计和构建了框架内的软件容错架构,针对错误检测和错误恢复这两个容错关键问题提出了一系列容错方法和优化技术。本文的主要工作和创新点体现在:1.以状态变迁图STG为基础,建立并行程序和CFD并行应用中的错误传播模型(第二章)硬件故障在并行程序中的传播行为是研究面向硬件故障的软件容错技术基础,而对并行程序的抽象建模又是故障传播行为研究的基础。本文首先提出了基于程序状态跟踪的状态变迁图理论,在状态变迁图理论中,对冲突、因果、并发关系进行了抽象,同时也支持系统间的交互抽象和行为抽象。基于状态变迁图STG理论,我们对故障在并行程序中的传播行为进行了分析,包括原生错误、数据流生错误和控制流生错误以及通信引起的传播错误等,并分别给出了错误传播方程及相关求解算法。同时,本文还从CFD并行应用的连续模型和离散模型出发,对他们的核心计算过程和特征进行了分析,得到连续CFD模型下以差分操作为核心的计算模式和离散CFD模型下以模板为核心的计算模式,并将两类CFD模拟计算核心特征统一抽象为以计算模板为核心的计算模式。以模板计算为基础,我们给出了错误在计算模板中的传播方程,以及CFD模拟过程中应用级错误传播相关求解算法。2.基于现有CFD并行应用软件框架提出了面向CFD并行应用框架的容错架构(第叁章)基于并行程序错误传播模型和CFD应用级错误传播模型,在现有CFD并行应用软件框架的基础上,设计了面向CFD并行应用框架的容错架构。结合CFD应用中的天然容错基础和相关容错需求,我们设计了CFD并行应用框架下的同步回滚方法和异步回滚方法。在同步回滚方法中,重点利用CFD原有的周期性快照输出以最小代价实现检查点备份操作。而在异步回滚方法中,采用用户级sender-based消息日志技术,解决了失效进程的通信重演问题。3.结合离散CFD应用特征提出了面向模板计算的软错误检测方法——GSDMR(第四章)本文基于应用级错误传播模型,结合离散模型的CFD并行应用特征,提出了基于网格采样的双模冗余检错方法,能够大幅度减少模板计算中对软错误的检错开销。我们基于软错误在网格上的传播规律,并使用数学建模量化分析了如何获得GS-DMR方法中的最优检错周期、最优检查点周期和最优网格采样尺寸等,以及获取这些最优参数的启发式算法。针对GS-DMR方法中错误传播延迟带来的检错盲区问题,我们提出了包括冒险检查点、多重检查点和混合检错在内的多重解决策略,并根据实用性需求选择了混合检错方案。4.提出了检查点异步流水I/O优化方法——AP-IO(第五章)本文针对checkpoint开销过大的问题,提出异步流水检查点I/O优化方法——AP-IO,将形成检查点备份数据的多个数据场采用流水方式异步写出,而不是在时间步末尾集中输出,以获取更多的可用隐藏时间。同时针对某些CFD应用异步流水I/O隐藏时间仍然不够的情况,在异步流水I/O思想的基础上,我们进一步提出了应用级场数据计算调度的思想,通过合理调度CFD场数据的计算顺序,为整体快照输出获得更多可用隐藏时间。

张立华[8]2013年在《浅论数值线性代数课程的教学改革》文中研究表明数值线性代数是一门介绍科学计算核心理论和基本方法的数学课程。根据数值线性代数课程和当前学生的特点,从教学内容、教学方法、考核形式叁方面对该课程的教学改革进行了初步探讨与研究。

欧阳异能, 杨婷[9]2014年在《MATLAB在线性代数课程中的应用》文中研究说明结合线性代数课程特点,引入计算软件MATLAB辅助教学,探讨MATLAB在线性代数中的矩阵运算、行列式计算、向量组的线性相关性、线性方程组求解以及特征值和特征向量等若干问题方面的应用,以期提高教学质量,改进教学效果.

吕世虎[10]2009年在《中国当代中学数学课程发展的历程及其启示》文中进行了进一步梳理进入21世纪,我国实施了新一轮基础教育课程改革,课程研究空前繁荣。相对于一般课程理论研究而言,我国数学课程理论研究则处于刚起步阶段。数学课程理论研究的不足使得中国数学教育界在面对基础教育数学课程改革实践提出的许多问题时显得无奈,对于数学课程改革的争论也是凭借个人经验有感而发,缺少理性的思考和理论的指导,常常陷入循环圈中。事实上,新一轮基础教育数学课程改革实践提出的许多问题在历次课程改革中都曾经出现过,从历史的角度审视和研究这些问题应当是建构中国数学课程理论的重要视角。本研究的论题“中国当代中学数学课程的发展历程及其启示”属于“中国数学教育史”的研究领域。该研究对于揭示中国数学教育的特征,建构中国特色的数学教育理论,解决基础教育数学课程改革中出现的问题具有重要意义。本研究主要运用历史研究法、文献法、比较法、文本分析法、访谈法等研究方法来进行问题的研究与讨论。本文拟研究的问题是“中国当代中学数学课程发展的历史给予我们什么样的经验和启示?”对于这个问题,又分解为叁个子问题:中国当代中学数学课程发展的历程是怎样的?中国当代中学数学课程发展具有哪些特点?中国当代中学数学课程发展的历史对当今的数学课程改革有哪些启示?对于这叁个子问题回答即是本研究的结论。本研究以数学教学大纲(数学课程标准)和数学教材的发展演变为线索,将中国当代数学课程的发展分为3个阶段:选择数学课程发展道路时期(1949—1957),探索中国数学课程体系时期(1958—1991),建立中国数学课程体系时期(1992—2000)。对每个阶段,从背景、事件及其影响叁个方面梳理中学数学课程发展的历程。通过对当代(1949—2000年)代表性的数学教学大纲、主要的数学教材进行纵向比较,从课程目标(教学目标)、课程内容、课程选择性、课程编排方式等方面,梳理总结出这一时期数学课程发展具有如下特点:中学数学课程目标体系由只有一般目标发展成为一般目标和具体目标相结合的目标体系,基本上形成了一个多方面、多层次,宏观与微观相结合的比较完善的目标结构体系。对目标的陈述方式也经历了由抽象、模糊到具体、明确、可操作的过程;中学数学课程的知识领域和知识单元的数量呈“正弦曲线”变化态势;中学数学课程的选择性经历了由“一纲一本→多纲多本→一纲一本→多纲多本”的循环式发展;中学数学课程内容的整体编排方式经历了由“分科→混合→分科→混合”的循环性发展。平面几何受苏联几何内容处理方式的影响,采用论证几何体系,并成为50年中几何内容处理方式的主流。代数内容在各个时期都采用“数→式→方程→函数”的处理方式,也出现过采用“数→方程→式→函数”的处理方式。在上述基础上,对我国当今数学课程改革提出了如下建议:数学课程目标的表述应当继承重视“结果”的传统,“结果”目标与“过程”目标并重;数学课程目标的表述应当具体明确,将学段目标、年级目标、知识领域目标、知识单元目标、知识点目标结合起来;数学课程内容的选择应处理好稳定与发展的关系;数学课程内容的处理应恰当把握“理论与实践”的关系;数学课程内容现代化应与学生接受能力、教师的教学水平相适应;数学课程的选择性,应关注地区差异,分类设置课程,编写区域化教科书,处理好理想与现实的关系;数学课程内容的综合化要以主线统领,各知识领域内容相对集中,不宜太分散;几何内容编排应兼顾传统,采用实验几何与论证几何结合的方式为宜。本研究的创新之处是:以教学大纲、教材为线索,系统梳理了我国当代数学课程发展的历史,补正了已有研究中的一些缺漏;通过对教学大纲、教材的定量和定性比较研究,揭示了中国当代中学数学课程发展的特点;以史为鉴,对我国当今数学课程改革面临的一些问题提出了解决的建议。但在研究过程中,对于史料(特别是教材)的收集不全面,对教材的特点研究不够。一些结论还需要从理论上加以提炼。

参考文献:

[1]. 基于发生教学法的线性空间概念的教学研究[D]. 朱琳. 华东师范大学. 2017

[2]. 分片代数曲线与离散Willmore问题研究[D]. 王少帆. 大连理工大学. 2010

[3]. 精细油藏数值模拟中的高效求解器研究[D]. 李政. 昆明理工大学. 2017

[4]. 可扩展并行代数多重网格算法研究[D]. 徐小文. 中国工程物理研究院. 2007

[5]. 工程电磁场耦合问题分析的若干数值技术研究[D]. 王金铭. 沈阳工业大学. 2006

[6]. FPGA矩阵计算并行算法与结构[D]. 邬贵明. 国防科学技术大学. 2011

[7]. 面向CFD并行应用框架的容错技术研究[D]. 任小广. 国防科学技术大学. 2014

[8]. 浅论数值线性代数课程的教学改革[J]. 张立华. 榆林学院学报. 2013

[9]. MATLAB在线性代数课程中的应用[J]. 欧阳异能, 杨婷. 数学学习与研究. 2014

[10]. 中国当代中学数学课程发展的历程及其启示[D]. 吕世虎. 东北师范大学. 2009

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

数值线性代数中的若干问题
下载Doc文档

猜你喜欢