面向汽车工业的HPC仿真云平台设计与实现
王英资1,韩盼盼1,2,方祥毅1
(1.中国汽车技术研究中心,天津300300;2.南开大学统计与数据科学学院,天津300100)
摘 要: 随着汽车市场规模的日益扩大,各种设计、仿真软件所需的计算量也成倍增长。为给用户提供按需使用高性能服务并解决用户应用部署的依赖性问题,提升行业整体计算能力,结合汽车行业特点,设计并实现了一种面向汽车工业、基于分布式架构的高性能仿真云平台。该平台在充分利用硬件资源的基础上,通过集成各项业务所需的仿真软件,为用户提供云化的高性能租用服务,解决了高性能计算资源建设周期长、成本高以及资源闲置等问题。
关键词: 高性能计算;仿真云平台;分布式架构
0 引言
在经济与科技高速发展的今天,汽车工业已成为全球规模最大,同时也是最重要的工业产业之一。从某种意义上来说,汽车工业的发展一定程度上带动了国家经济发展,促进了GDP增长。一个国家汽车工业水平的高低反映了其综合实力强弱,也体现了其在国际竞争中的位置。
随着汽车市场规模的不断扩大,人们对设计精度、合格率、多种设计方案并行等方面要求越来越高,各种设计、仿真软件所需的计算量也成倍增长。在计算量井喷式增长的情况下,传统计算设备已很难满足作业需求。本文旨在搭建一个面向汽车工业的高性能仿真云平台,在充分利用硬件资源的基础上,通过集成各项业务所需的仿真软件,不仅可以满足汽车行业的计算需求,还可以为相关行业、研究机构、高等院校等提供高性能仿真服务,以大幅降低成本、提升工作效率,从而更好地促进汽车行业发展。
1 国内外研究现状与趋势
1.1 高性能计算
高性能计算(High Performance Computing,HPC)是指利用并行处理和互联技术将多个计算节点连接起来,从而高效、可靠、快速运行高级应用程序的过程[1],其通常包含很多处理器。它是计算机科学的一个分支,常用于研究并行算法及开发相关软件。
自1946年电子计算机ENIAC诞生之后,高性能计算的发展主要经历了以下几个阶段:①20世纪70年代初的并行向量处理机(PVP);②随着微处理器性能的不断提高[2],对称式共享存储器多处理机(SMP)应运而生,随后又出现了分布式共享存储器多处理机(DSM),逐渐取代了PVP;③20世纪90年代初出现了拥有物理逻辑多地址空间的大规模并行处理机(MPP),并占据了高性能计算市场;④随后,计算机集群通过网络将本地多台计算机紧密集成在一起,以实现更高的工作效率;⑤现阶段,云计算的出现进一步推动了高性能计算的发展。
下面以重庆万州500 kV长江大跨越工程为例,对比分析计算了6种大跨越导线方案,结果表明高强度耐热铝合金导线方案具有明显优势,为今后低海拔地区500 kV大跨越工程提供参考。
美国、欧洲等一些发达国家都非常重视高性能计算技术的研究与应用,美国一直将发展高性能计算作为国家的战略重点,在克林顿时代即大力推行HPCC计划,并取得了显著成效[3]。在2011年6月的全球高性能计算Top500排名中,美国共拥有256台超级计算机,以远超其它国家的优势稳居世界第一。中国也在不断加大高性能计算领域的投入,从“863计划”到“973计划”,再到2015年国家科学技术部提出的“国家重点研发计划”,“十三五”阶段国家高性能计算环境整合资源的能力得到进一步提升,共聚集了19个单位[4],经过多年的不懈努力,中国的高性能计算水平已跻身世界前列[5]。曙光5000A和“天河一号”的问世,使中国一跃成为高性能计算强国[6]。在 2017年11月的全球高性能计算Top500排名中,中国以202台超级计算机的优势超过了美国,中国研制的“神威·太湖之光”连续4次位居榜首。
仿真云平台共包含4层架构,分别为:应用门户层、管理层、工业云OS层和硬件资源层。其中,应用门户层是用户了解并使用仿真云平台的窗口。
表1 高性能计算在汽车工业领域的应用
徐光宪院士曾提出:“进入21世纪以来,计算方法与分子模拟、虚拟实验,已经成为继实验方法、理论方法之后第3个重要的科学方法,对未来科学与技术的发展将起到越来越重要的作用。”当理论模型较为复杂甚至尚未建立,或实验费用昂贵,可能无法进行时,计算则成为求解问题的唯一或主要手段[7]。因此,高性能计算的不断普及已是大势所趋。
1.2 仿真云
“云”是对网络、互联网的一种比喻,过去在图中往往用云表示电信网,后来也用来表示互联网和底层基础设施的抽象[8]。目前,云计算正成为信息领域的研究热点[9],但至今尚没有对云计算的明确定义。现阶段被广为接受的是NIST的定义:云计算是一种按使用量付费的模式,该模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务)[10],这些资源能够被快速提供,只需很少的管理工作,或与服务供应商进行很少的交互。目前,云计算主要包含3个层次的服务:基础设施即服务(IaaS)、平台即服务(PaaS)与软件即服务(SaaS)。
为了满足用户日益增长的个性化需求,李伯虎等[11]在2005年提出“云仿真”概念,将云计算与仿真相结合。“云平台”也称为“云计算平台”,该平台允许程序员们将写好的程序放在“云”里运行,或使用“云”提供的服务。云仿真平台是一种新的基于云计算理念的网络化建模仿真平台,是对仿真网格的进一步发展。其支持一种新的仿真模式——“云仿真”模式,利用网络和云仿真平台按需组织各种仿真资源,为用户提供各种建模和仿真服务[11]。
近年来,国内外很多学者对仿真云平台进行了大量研究,也取得了一定成果,例如:刘俊文[12]通过分析电网数据中心仿真云平台开发现状,针对现存问题及需求提出部署方案,以提高电力系统稳健性;杜静[13]对大规模网络平台进行探索,为实现高性能仿真提供了可借鉴的理论依据;赵继丛[14]以仿真模型重用为目标设计并实现了一个面向模型重用的仿真云服务平台(SCSP);张亚琦[15]在分析云应用服务特点基础上,结合教育服务资源分布不均及资源利用率低等问题,建立教育云平台服务架构,实现了对资源的整合利用。国内也有很多知名云平台,如阿里云、腾讯、百度云、新浪、京东、华为等。一个具有良好可扩展性与适用性的云计算平台,可为用户及第三方服务提供商提供良好的云计算服务接入环境。
云OS,又称为云操作系统、云计算操作系统,是以云计算、云存储技术作为支撑的操作系统,也是云计算后台数据中心的整体管理运营系统[19]。云OS在云平台框架中是十分关键的,其向上承接管理层,通过网络为用户按需提供资源,并根据使用量收取费用,向下连接硬件资源层,实现对各类异构软硬件基础资源的兼容与资源动态流转。
表2 CAE软件应用及特点
针对高性能计算在汽车工业不同方向的应用,仿真软件具体应用如表3所示。
表3 仿真软件在汽车行业的应用
2 高性能仿真云平台架构设计
2.1 体系架构
HPC仿真云平台通过整合多款应用软件,实现仿真计算、工业设计一体化操作,采用模块化分布式架构理念,为用户提供全方位的工业设计、作业调度、平台系统监控管理等功能,可有效提高管理效率,降低运维成本。“分布式”是指一种将应用程序分布在不同计算机上,通过网络共同完成一项任务的工作方式,其可以实现在两个或多个软件中的资源共享,也可以在多台计算机上平衡计算负载。系统采用分布式架构设计,可使产品具备很强的灵活性与可扩展性,能充分满足不同用户的需求。
高性能计算用户群体遍布军事、航空航天、经济、气象等领域,其在汽车工业领域也发挥着重要作用。从汽车造型设计,到零部件与发动机制造,再到汽车组装及出厂前汽车性能的一系列测试,都离不开高性能计算。具体应用如表1所示。
资源池是指围绕业务系统,将其主要涉及的可用资源进行通用化、平台化与模块化整合[18]。其打破了服务器机箱限制,将所有资源解放出来并汇集到一起,形成一个个资源池。当用户产生需求时,便自动从池中配置出能够满足需求的组合。
(3)更好地设计研发计划的组成,成立欧洲创新理事会,加大对创新活动的支持,用新机构、新机制有效支持计划对各类创新行为的投入。
工业设计仿真云是一个能涵盖企业PDM/PLM产品数据管理、CAD设计、CAE模拟仿真、制造过程管理等多个方面的综合技术。CAD是以计算机技术为基础对实物进行模拟设计的一种技术手段,能展示物体的结构、色彩、质感、外形等要素,在汽车制造、航空航天等领域应用广泛[16]。常见的 CAD 软件有:CATIA、Pro/Engineer、UG NX、Solid-Works、AutoCAD等。CAE是用计算机技术辅助求解复杂工程与产品性能的一种近似数值分析方法,泛指包括分析、计算与仿真在内的一切研发活动[17]。CAE软件可进行动力学分析、静态结构分析与动态分析,用于研究线性、非线性问题,以及分析结构(固体)、流体、电磁等。CAE并不是独立于CAD单独存在的,而是二者相辅相成,共同完成产品的研发设计。常见的几款CAE软件及其应用分类、特点如表2所示。
(2)先进的用户管理模式。用户申请机时的时候,实现精细粒度的资源记账与配额统筹,根据不同用户的计算需求为其充值,提供全局统一的用户配额策略。
图1 HPC云平台架构
管理层主要负责应用管理、用户管理以及系统性能监控。通过对系统的监控,可及时了解各服务器健康状态,一旦出现状况则及时修复,以保障云平台的正常运行。对用户操作行为进行管理并实行按需收费政策,既是对平台运行秩序的维护,也是对用户自身权益的一种保障。
2.2 云平台性能及优点
(1)丰富的软件集成仓库。云平台上的软件安装简单、使用方便,可免去用户四处查找、安装软件的烦恼,而且节约了大量成本。
(2)用户需求分类汇总。按照部门统计一周内每天作业所需的刀片计算节点并行核心数、SMP计算节点并行核心数,得到公司每天总体所需的计算节点并行核心数;按照部门分类汇总运行每款软件的年所需空间,并统计总年使用空间。
4.增设奖励机制,在课堂上要经常挑选出一些学生用心写出来的作品进行阅读并且给予一定的表扬和肯定,让各位同学在语文学习中思维更加活跃,积极性更高。
2016年底,云南建设完成1个统筹全省服务资源的枢纽服务平台、16个州市综合服务窗口平台和13个重点产业集群(行业)专业窗口服务平台的网络体系。两年来平台累计带动1398家服务机构,其中有近330家服务机构在平台网络在线系统通过发布服务信息、开展线上服务等方式,为全省中小微企业不同发展阶段提供全方位服务支撑。每年依托各州市中小企业“窗口”服务平台,重点围绕政策解读、信息发布、创业辅导、技术支撑、互动对接、展览展示、创新论坛等内容,采取形式多样、种类丰富的方式集中开展了“双创”活动。
(3)稳定的操作服务系统。云平台采用分布式架构,不仅提升了运算速度,而且当其中一台服务器出现问题时,当前任务会迅速转移到其它空闲服务器上,从而保证任务的顺利进行,避免了系统故障带来的损失。
(3)确定建设目标与内容。根据公司业务发展需要,结合实际情况,制定合适的建设阶段目标,将总目标具体化;建设内容包括基础软件层、计算存储层、网络层以及机房设施层,并在此基础上完成应用软件测试工作。
(5)强大的可操控性。移动客户端为用户提供全方位的集群监控服务,使用户可以及时掌握集群健康状态,包括告警信息、服务器监控指标信息、资源利用情况、网络可用性等指标,并保证用户能在系统发生故障的第一时间得到消息并进行快速处理。
3 关键技术
3.1 作业提交功能设计
系统预定义了几十种软件的应用Portal,例如:应用于无人驾驶汽车的CarMaker并支持定制化与自定义开发,可以根据不同的高性能计算应用,为用户提供不同的Portal界面,从而极大简化了作业提交过程,方便用户进行业务计算。
经过20余年的发展,目前天然气发电已在我国发电行业占有一席之地,其低污染、高效率、启停灵活等优势日益得到业内认同。虽然目前还面临着气价波动、运维费用高等问题,但预计在“十三五”及以后一段时期,天然气发电将迎来新的发展机遇。
图2 作业提交
3.2 作业状态控制
“作业热图”为用户提供当前集群作业的总体概览,从用户作业、节点作业多角度监控作业运行情况,并运用不同颜色进行区分。通过智能统计作业分布状态,使用户可以了解系统内资源的占用、预留情况,并对作业状况进行实时监控。
图3 作业热图
作业调度包含用户在线注册、资源弹性申请、预充值与实时计费等各项信息,在Web界面上可以实时查看详细作业信息与计算结果文件。作业调度的主要功能是依据作业控制块中提供的信息,分析系统是否能够满足用户提交作业的资源需求,如果可以,则选取该项作业调入系统内存中,并为其分配资源进行作业。通过强大的作业调度功能,可以实现对作业的灵活管理。
图4 作业调度
4 汽车工业HPC仿真云平台设计实例
4.1 HPC方案编制主要步骤
(1)用户需求调研。调研用户当前工作对软件的需求,调研内容包括:软件名称、使用人数、购买的Linsense、应用领域及应用特点、平台要求、计算方式(并行/单核)、计算规模、计算时间要求、并行核数、同时运行用户数、运行频率、所需核心数汇总、存储容量等。
光敏电阻,是利用半导体的光电效应制成的一种电阻,其阻值随入射光的强弱而改变,具有以下特点:光谱响应宽;测试光强范围宽,即可对强光响应,也可对弱光响应;无极性区分,使用方便,成本低,寿命长;灵敏度高,工作电流大,可达数毫安[2]。
对于灰色定权聚类分析方法而言,白化权函数的表达式通常由相关行业的专家给定,决策权ηj的值可通过专家法进行确定,也可通过下述方法确定:
(4)简洁的HPC云门户。应用界面清晰、简洁,符合用户一般习惯。采用“计算+工业设计”一体化模式,可在平台上实现应用发布、用户及数据统一管理功能,云平台移动客户端为用户随时随地工作创造了可能,满足了客户处理紧急业务的需要。
德育目标和教育目的所凸显的对学校德育工作最基本的要求即是德育原则,其中包括:知行统一原则、严格要求学生和尊重学生个人意志相结合的原则、因材施教原则等等。为了更好地发挥高中德育工作的作用,应将陶冶教育法在尊重高中育人的基本原则下,并用于其他的德育方法,以期德育可以更好地实行。中学生很容易产生疑惑,尤其是在成长的关键阶段,所以德育者合适的方法和因材施教的原则就显得尤其重要。
(4)确定建设方案。
图5 建设方案
(5)确定设备列表与高性能集群拓扑图。
小厂还不错,环境好,有花有草的,东西排放得整齐,洗手间都飘着淡淡的清香。这大概就是女老板的特点了。大发厂的洗手间永远都是臭烘烘的,林老板从来都不会过问。
(6)确定高性能集群配置表。包括计算节点配置表、存储系统配置表、网络系统配置表、软件系统配置表。
(7)撰写高性能计算集群方案。主要内容包括项目背景、项目建设目标、高性能计算平台建设方案、远程可视化平台建设方案、设计专网及安全防护方案等。
表2中各待测元素的分析同位素质谱线及分辨率就是按照上述原则优选出来的。其中Ca和In的选择稍有不同。理论上Ca元素的同位素中40Ca的丰度最大(96.94%)但它被40Ar完全覆盖,即便在高分辨(R>10 000)下也无法完全分开,而Ar气正是产生辉光放电的重要部分,它充满了整个激发室,对40Ca的干扰无法避免。因此只能选择丰度第二(2.09%)的44Ca作为分析Ca含量的质谱线。
4.2 汽车工业HPC仿真云平台架构
通过对现有高性能平台节点数量、计算能力的调研可知,当前高校高性能平台的计算能力大多在几十到几百万亿次每秒,超算中心高性能计算机的计算能力在千万亿次以上。现有高性能平台分类如表4所示。
表4 现有高性能平台分类
在充分了解工业仿真云平台构架的基础上,结合汽车行业特点,搭建分布式汽车工业HPC仿真云平台架构如图6所示。仿真云平台架构共包含4层,分别是:展现层、业务层、管理层与资源层。
其中,资源层集成了平台所需的计算服务器、基础环境、存储、网络、License服务器与可视化服务器;管理层包含用户管理、虚拟桌面管理、虚拟机管理、告警引擎、报表引擎、应用License服务,承接业务层和资源层,以保证平台的正常运作;业务层涵盖基础管理平台、HPC云作业调度平台与远程可视化平台,主要负责系统的部署、监控与管理,负责作业提交、调度,以及虚拟桌面、3D可视化的管理;展现层是仿真云平台的对外窗口,云平台通过展现层为用户按需提供服务,同时用户也可通过展现层监控云平台运行状况。
图6 汽车工业HPC仿真云平台架构
5 总结与展望
在大数据时代背景下,数据量呈指数级增长,单纯依靠传统计算设备已很难满足行业需求。本文针对高性能计算、仿真云、高性能仿真平台架构、汽车工业仿真云平台4个方面进行介绍,并搭建了汽车工业分布式仿真云平台架构。该平台集成了仿真所需的硬件与软件设备,实现了仿真计算、工业设计一体化操作,用户可随时监控平台系统运营状况,简捷的应用页面也为用户带来全新体验,从而缩短了计算时间,提高了工作效率。该平台可有效解决高性能计算资源建设周期长、成本高以及资源闲置等问题。
参考文献:
[1]郑晓欢,陈明奇,唐川,等.全球高性能计算发展态势分析[J].世界科技研究与发展,2018,40(3):249-260.
[2]李波,曹福毅,王祥凤.高性能计算技术发展概述[J].沈阳工程学院学报:自然科学版,2012,8(3):252-254,269.
[3]周兴铭.高性能计算技术发展[J].自然杂志,2011,33(5):249-254,246.
[4]迟学斌.高性能计算环境与应用[J].国防科技工业,2018(5):21-22.
[5]奚国华.迎接21世纪信息通信发展新挑战[J].中国无线电管理,2003(12):1-5.
[6]张军华,臧胜涛,单联瑜,等.高性能计算的发展现状及趋势[J].石油地球物理勘探,2010,45(6):918-925.
[7]DIMITRIOS T,HELEN K.High performance system based on cloud and beyond:jungle computing[J].Journal of Computational Science,2017.
[8]于巧稚.CEO需要了解的云计算[J].中国建设信息,2012(6):10-15.
[9]MICHAEL A,ARMANDO F,REAN G,et al.Above the clouds:a Berkeley view of cloud computing[EB/OL].http://www.eecs.berkeley.edu/Pubs/Tech Rpts/2009/EECS-2009-28.pdf.
[10]MELL P,GRANCE T.The NIST definition of cloud computing[J].National Institute of Standers and Technology,2011,53(6):50.
[11]李伯虎,柴旭东,侯宝存,等.一种基于云计算理念的网络化建模与仿真平台——“云仿真平台”[J].系统仿真学报,2009,21(17):5292-5299.
[12]刘俊文,玄佳兴.数据中心仿真云平台的功能需求与设计[J].电信科学,2017,33(5):176-182.
[13]杜静,王琼,秦富童,等.面向大规模网络的高性能仿真平台建设思维探讨[J].计算机科学,2016,43(S1):276-280.
[14]赵继丛,黄利平,陈俊宇,等.面向模型重用的仿真云服务平台设计与实现[J].图学学报,2017,38(6):857-864.
[15]张亚琦.教育云平台应用服务架构建模与实现[D].武汉:武汉理工大学,2014.
[16]衡斌.CAD/CAE技术在机械设计与模具设计中的应用[J].内燃机与配件,2018(8):116-117.
[17]杨鼎宁,邹经湘,盖登宇.计算机辅助工程(CAE)及其发展[J].力学与实践,2005(3):7-16.
[18]王健伟.一种全新的IT建设架构——统一资源池[J].数据通信,2011(5):10-12.
[19]蒙安红.云计算机系统功能特点及高校计算机实训平台构建[J].电子技术与软件工程,2017(9):138-139.
Design and Implement of HPC Simulation Cloud Platform for Automobile Industry
WANG Ying-zi1,HAN Pan-pan1,2,FANG Xiang-yi1
(1.Chinese Automotive Technology&Research Centre ,Tianjin 300300,China ;2.Department of Statistics and Data Science ,Nankai University ,Tianjin 300100,China )
Abstract: The scale of automobile market is expanding day by day,and the amount of calculation required by various design and simulation software increases exponentially.To provide users with on-demand using of high performance services,solve the users’dependency problems of application deployment and improve the whole computing power of industry,combining the characteristics of automobile industry,this paper designs and realizes a kind of high performance simulation cloud platform for automobile industry based on the distributed architecture.The platform makes full use of hardware resources and integrates simulation software required by various businesses.It can provide the cloud with high performance rental services for users and solve the problems on high performance computing such as long resources construction cycle,huge cost and idle resources and so on.
Key Words: high performance computing;simulation cloud platform;distributed architecture
DOI: 10.11907/rjdk.182787
开放科学(资源服务)标识码(OSID):
中图分类号: TP319
文献标识码: A
文章编号: 1672-7800(2019)009-0097-05
收稿日期: 2018-11-26
作者简介: 王英资(1988-),女,硕士,中国汽车技术研究中心有限公司工程师,研究方向为数据库技术、架构设计、高性能运算等。
(责任编辑:黄 健)
标签:高性能计算论文; 仿真云平台论文; 分布式架构论文; 中国汽车技术研究中心论文; 南开大学统计与数据科学学院论文;