基于贝叶斯推断的复杂系统可靠性分析
苏续军1吕学志2
1(陆军工程大学石家庄校区 河北 石家庄 050003)2(陆军第九综合训练基地教研部 河北 宣化 075100)
摘 要 随着武器装备系统日益复杂,成本越来越高,大量的全面系统测试逐渐变得不可行,很难得到大量的可靠性信息,可靠性的统计分析与评估面临着挑战。提出一种基于贝叶斯推断的复杂系统可靠性分析方法,介绍贝叶斯推断以及基于贝叶斯推断的复杂可靠性分析步骤。利用事件树图对复杂系统结构进行建模,归纳可用的数据类型,对组件随机模型和先验分布进行描述。利用马尔科夫蒙特卡洛方法对模型进行求解;构建计算示例验证方法的可行性与有效性。该方法适用于不同的建模粒度,可以灵活地融合专家知识、全系统测试数据、子系统和组件级数据,一致性地估计系统、子系统和组件的可靠性参数。
关键词 贝叶斯推断 复杂系统 可靠性分析 马尔科夫链蒙特卡罗 OpenBUGS
0 引 言
军队通常储备大量武器、弹药和备件,如何评估和分析这种复杂系统可靠性不仅关乎这些武器系统的管理和维护,还会对训练和作战使用产生影响。利用传统方法评估和分析复杂系统可靠性的最大问题在于数据样本少。一是装备本身较少,与其类似装备较少,特别是处于研制阶段的装备,这使得装备试验数据样本少。二是有些装备可靠性高、寿命长,短时间很难产生大量的可靠性数据样本。三是对于昂贵的一次性使用的弹药类武器装备,不可能进行大量试验,因此不能得到大量数据样本。但是,还有其他来源的系统可靠性信息。例如,组件、子系统如何相互连接以在系统中发挥功能的信息;组件和子系统的测试信息可能是可用的;与组件、子系统、系统相关的工程知识,例如目视检查和其他无损检测数据。通常,从这些其他信息来源获得的数据可能会大大超过全系统测试的数据,因此将这些信息纳入分析方法可以大大提高预测和估计的精度。问题在于如何给出一种通过融合各级数据和专家知识来分析评估复杂系统可靠性的方法。
为了生成正确的答案(最基本的目标),自然问答模型需要从候选事实集合中选择一个最合适的事实。给定问题Q和主题实体e,首先从知识库中检索出候选集合Ce={(e,p,o)},(e,p,o)∈KB,并利用问句事实匹配模块选择最合适的事实定义基于神经网络模型的匹配函数fQ(s,p)(考虑到问题一般只包含主语和谓词的信息,因此在计算问题与事实匹配得分的时候不考虑宾语部分)计算问题Q和事实三元组(s,p,o)的匹配得分,最终的匹配三元组为
本文将使用贝叶斯方法来解决这个问题。贝叶斯方法较传统的频率方法有以下优势:(1) 适合数据稀少的情况。当数据稀少时,频率估计量(如极大似然估计)可能变得不合理;(2) 通过蒙特卡洛抽样可以很好地解决区间估计,而对于频率方法传播频率区间估计(如置信区间)会比较困难;(3) 具有通用性。而频率方法有时存在一题一法的问题;(4) 具有融合多种信息的能力,而频率方法无法在计算过程中处理“非数据”信息。
国外对贝叶斯方法在可靠性方面的应用研究比较深入。Martz等出版的《贝叶斯可靠性分析》是最早的从贝叶斯角度研究可靠性的专著[1]。随着数值模拟技术的进步,贝叶斯方法在科学研究与工程实践中都获得了更加广泛的应用。Hamada等出版的《贝叶斯可靠性》主要介绍贝叶斯方法在可靠性数据分析中的应用,重点介绍如何利用数值模拟技术有效地实现基于贝叶斯理论的可靠性分析[2]。Kelly等在著作中详细探讨了贝叶斯推断在概率风险评估中的运用[3]。文献[4-5]运用贝叶斯方法对串联系统和串/并联系统可靠性进行了研究,用β分布描述组件的先验分布,并通过复杂的β分布近似推导得到系统后验分布,但是该方法无法通过整个系统的数据来估计单个组件的可靠性。文献[6-7]提供了通过系统结构传播组件后验获得精确或近似的系统可靠性分布的方法。文献[8]提出了基于最大熵原理的评估系统可靠性后验分布矩的方法。文献[9]运用蒙特卡罗模拟方法对上述问题进行了求解,不需要进行近似推导。结果显示,通过融合系统测试数据,系统可靠性要比仅融合组件和子系统测试数据的可靠性低,对某些组件的可靠性估计值大大降低。文献[10-13]利用贝叶斯方法对复杂系统的故障数据融合问题进行了探讨。国内学者多运用贝叶斯方法研究了多种产品的可靠性,但仅关注于单层组件(系统)的信息融合。文献[14]应用贝叶斯方法分析了故障数据小样本条件下的数控机床可靠性。文献[15]应用贝叶斯方法分析了光纤陀螺光源可靠性。文献[16]应用贝叶斯方法评估了铣头可靠性。
本文将给出一种基于贝叶斯推断的复杂系统可靠性分析方法,可以集成融合各种来源的信息(全系统测试、组件测试和专家工程判断),在系统测试数据有限的情况下或没有系统测试数据的情况下,可以一致性地预测复杂系统及其组件的可靠性。
1 贝叶斯推断概述
贝叶斯定理提供了在概率环境下,融合信息和数据以更新先验知识的数学手段。通过下面的表达式,该定理修正了先验概率,得到后验概率:
(1)
式中:Pr(H |D )为后验分布,以与假设H 相关的数据D 为条件;Pr(H )为先验分布,来源于假设H ,与数据D 独立;Pr(D |H )为似然函数或随机模型,刻画产生数据D 的过程与机理;Pr(D )为边缘分布,起归一化常数的作用。
教师选择在自己的课堂上运用小组合作的教学方式,并不是教师安排好任务,让学生在一旁讨论,自己在一旁看着。而是需要教师参与到每个小组中,分析每个小组所面临的问题,为每个小组提出积极的解决方案。教师的课后时间是有限的,在课后不可能与全班学生都进行交流,所以学生对知识点的理解需要教师在课上进行了解。小学阶段的学生玩心重,他们是否觉得一节课有趣,是否愿意把自己的关注力放在课堂上,这与教师有很大关系,小组合作学习需要分工明确,需要教师合理分配每位小组成员,但是更需要教师参与到每个小组中。只要教师积极参与到所有小组中,就会立刻发现小组内合作研究的内容是否正确,才能立即对小组进行指导。
式中:S 2表示i 和m 构成的组合(i ,m ),表明专家m 对部件i 进行了组件分组的工程判断。
(2)
式中:π 1(θ |x )是参数θ (可能为向量)的后验分布。这个后验分布θ 是所有与相关的推断声明的基础,也是模型验证方法的基础。观察数据通过似然函数f (x |θ )进入贝叶斯定理。π 0(θ )是参数θ 的先验分布。
分母部分f (x )是θ 所有可能取值的积分,是一个加权平均分布,权函数是先验分布π 0(θ )。当X 为离散随机变量(如某段时间内发生的事件数)时,f (x )是恰好发生x 个事件的概率,与θ 的取值无关。当X 为连续随机变量时,例如维修时间,f (x )是密度函数,给出了无穷小区间内x 观察值得无条件概率。
似然函数f (x |θ )还有另外一个名字,即描述观察到的物理过程的随机模型。似然函数与数据收集和计算过程有着内在的联系,特定的似然函数意味着特定形式的数据。似然函数常常是二项分布、泊松分布或指数分布,对应的数据形式分别是在收到一定数量请求中成功(故障)的次数、一定时间段内的成功(故障)数量和成功(故障)时间。
集成预测结果hensemble(x)=f(hi(x))=y与Bagging算法不同,Boosting算法第一次构建基分类器给每一个训练数据样本赋予动态权重,加强分类错误样本权重。在下一次基分类器采用新的样本权重进行随机抽样构建新的基分类器并以此类推构建多个基分类器,并形成一个精度较高的强分类器。
π 0(θ )是参数θ 的先验分布,代表与数据无关的参数θ 的已知信息。广义上,先验分布可以区分为有信息和无信息。正如名字所示,有信息先验包含θ 可能取值的真实信息。而无信息先验使数据在后验分布中占支配地位,因此它包含的参数真实信息非常少。
进行贝叶斯推断的一般流程包括:
(1) 指定随机模型(如部件收到请求后未能改变工作状态而发生故障);
(2) 指定模型参数的先验分布,量化认知不确定性,即对参数可能取值的认识;
(3) 观察故障过程的数据或与之相关的数据;
(4) 更新参数的先验分布以得到后验分布;
(5) 检验随机模型、数据和先验分布的正确性。
2 复杂系统及其可靠性建模
对于贝叶斯推断方法而言,系统复杂性来源于系统的复杂结构、多样化的数据来源、不同组件的可靠性随机模型、不同组件可靠性参数的先验分布。这部分主要对复杂系统的结构模型、数据类型、似然函数和先验分布进行介绍。
2.1 结构模型
现实世界中,复杂系统的组件规模是非常庞大的,组件之间的关系也是非常复杂的。为了更加清晰地论述可靠性分析方法,需要简化复杂系统的一些细节,同时保留对贝叶斯推断构成挑战的所有系统特征。
系统的一些关键特征包括:首先,从逻辑上系统可以分解成子系统,这些子系统是集中于特定任务的自然分组。一些子系统直接组合以形成系统,而另一些子系统可以嵌套在其他子系统内。系统的描述形式在很大程度上取决于什么数据来源可用,以及工程师对系统功能的了解程度。其次,有些组件和子系统的数据可用,但是并不是所有组件和子系统的数据可用。最后,复杂系统可能有若干类型。例如,一种导弹可能会有若干种型号,这主要是因为某些组件存在差异(由不同制造厂家生产,具有不同功能,当然其可靠性会不同)。认为每种类型具有不同的可靠性,可以提高估计过程的精度,并且有助于深入了解哪些种类更有可能失效。
(4) 不太精确的工程判断。指出给定系统或相关系统中的一组组件具有类似的故障概率。例如,专家可以断言导弹电池的可靠性与相关导弹系统中的电池的可靠性相似,或者电动机的可靠性相似。或者,专家可以判断给定子系统的所有组件都可能导致该子系统的故障。这表明组件的可靠性被认为是相似的,但这并不意味着组件的故障机制是相同的。
如果p 2到p 4先验服从均匀分布,则该模型中p 1的后验均值为0.507。当系统未分解为子系统,并且p 1先验服从均匀分布,p 1(先验也服从均匀分布)后验均值为0.714。此外,在这种不使用层次贝叶斯模型的情况下,向事件树添加组件将产生的偏差,偏差将随着系统中的组件数量的增加而变得更加严重[19]。
图1 复杂系统的事件树图
组件和子系统由AND门连接,这意味着为了使整个系统运行工作,需要所有组件和子系统都运行工作。该系统被标记为C 1,由C 2、C 3、C 4组成;C 2由C 5、C 6、C 7(由C 10到C 17组成)组成,C 4由C 8、C 9组成。如前所述,将系统的各个部分划分为组件或子系统是主观的,并且取决于可用的信息。例如,组件C 3实际上由“组件”的集合组成,如果有可用数据,则可以将其表示为具有“组件”的“子系统” 。
图1所示的系统只有13个组件,子系统和系统中组件的嵌套级别为4级,因此并不是非常复杂的系统。这种方法可以应用于规模更大的问题,但为简单起见,本文只使用了这个比较简单的例子。本文提出的方法可扩展到具有更多组件和嵌套级别的系统,同时随着系统规模变大,估计和预测的计算量将大大增加。
当然,除了球星、俱乐部等职业人士外,许多广东的教育机构也设有自己的篮球课程,进一步助推篮球运动在青少年群体中的普及度。
2.2 数据分类
在估计复杂系统的可靠性时,通常在系统,子系统和组件级别上具有测试数据和工程判断。这里考虑了4类数据来源。
(1) 全系统测试数据。例如导弹的多次飞行测试结果(成功/失败)。
(2) 组件或子系统测试数据。通常的情况是,对于部分组件和子系统有测试数据,但不是全部组件和子系统都有测试数据。
(3) 关于特定组件或子系统发生故障可能性的工程判断。它代表了有关系统正常工作及其预期设计的大量主观知识,有助于限定可靠性,用先验分布来描述。
复杂系统结构有多种图形化的描述方法,例如故障树、贝叶斯网络、可靠性框图和事件树,本文将使用事件树来描述复杂系统[17-18]。本文考虑的复杂系统有3个主要子系统,共有13个组件。图1描述了该复杂系统的事件树图。
2.3 似然函数
在本文模型中,假设每个组件、子系统和完整系统的状态只有两种:成功或失效。这种二元状态是可靠性分析中最简单的状态描述方式。
二元状态的限制意味着独立测试结果服从二项分布。将整个系统表示为子系统和组件的串联形式,使得系统和子系统的状态取决于组件的状态。因此,子系统和全系统的似然函数是所有组件可靠性参数的函数,为二项分布。在二项随机模型中,X i 表示C i 成功次数的二项随机变量,可取0~n i 的任何整数。输出x i 的概率由分布密度Binomial(n i ,p i )给出:
(3)
式中:是二项系数,n i ! 是阶乘函数。二项系数给出了n i 次试验中有x i 次成功的可能组合(n i 中取x i 的组合数)。
2.4.2 组件分组
如前所述,从可计算性和模型一致性的角度来看,在可靠性图的不同层次上融合数据和先验信息通常被证明是有问题的。解决这个难题的方法是通过利用事件树图得到的确定性关系将终端(组件)节点概率重新描述为非终结(子系统)节点概率。例如,从图1可以看出,子系统C 7正常的概率p 7等于概率p 10到p 17的乘积,C 10到C 17每个组件全部正常工作。从而:
(4)
类似地,子系统C 4正常的概率为p 4=p 8×p 9。这种方法利用了系统可靠性的边际分布,为获得所有组件和子系统可靠性的联合分布提供了一个明智的解决方法。
2.4 先验分布
在许多应用中,工程判断可以在评估系统可靠性方面发挥重要作用,特别是对于各个组件的测试数据较少的大型复杂系统。工程判断需要一定的专业知识来确定组件的先验分布,并确定哪些数据与分析相关。这里主要讨论3种工程判断:
(1) 精确信息:专家通过描述组件的故障概率分布来提供关于单个组件可靠性先验知识的精确信息。
(2) 组件分组:专家将组件归为具有相似可靠性的组件组。这个假设并不要求组件在物理上是相似的,只是它们的可靠性是相似的。例如,所有高可靠性部件可能被判断为相似。可以通过层次模型描述这种类型的信息。
(3) 无信息:专家对组件可靠性没有太多先验知识,但是仍然可以通过提供组件的可靠性先验分布来描述组件可靠性信息不足的情况。
2.4.1 精确信息
就在这时,一个声音突然响了起来:“David Mitchell文学成就上能算个什么玩意?撑死畅销作家而已。”这让我精神为之一振。我在人群里搜索声音的主人,然后我看到一个高个子的青年人双手插兜离开了咖啡馆。
可以从几位专家获得工程判断,从每位专家获得的信息质量可能会有所不同。在模型中,假设专家m 给出p i 服从β分布的工程判断,这里令S 1表示集合(i ,m ),代表专家m 给出p i 的工程判断可用。β分布是一类灵活的概率分布,取值介于0和1之间,适合描述可靠性[2-3]。
更具体地,假设先验分布为:
B (p i ;Nσ i,m +1,N m (1-σ i,m )+1)
(5)
式中:σ i,m 代表专家m 对p i 的估计,N m 表示专家m 的估计精度。请注意,这不是β分布的标准形式,之所以这样选择是将分布均值作为理想参数特征之一。因为标准的β分布β (a ,b ),其分布均值为a /(a +b ),令a =N m σ i,m +1和b =N m (1-σ i,m )+1。有许多方法可以整合多个专家提供的信息,例如几何平均(对数的算术平均)和对数分布的5%和9%的分位点。本文采用平均(等权重)方法来综合不同专家的信息,具体见示例中的OpenBUGS代码。
假设σ i,m 服从参数μ i,m 和ν i,m 已知的β分布:
(6)
每个专家精度N m 服从参数α m 和β m 已知的γ分布:
采用竞价上网模式的电力投资项目投资开发前期应聘请专业的电价预测机构进行电价走势分析,从理想电价走势、适中的电价走势以及保守的电价走势三个层次进行电价走势敏感性预估。
(7)
总之,通过β分布可以描述p i 约为σ i,m 的工程判断。通过描述N m 的先验分布,可以更灵活地调整估计,并根据给定数据使用贝叶斯定理来得到N m 后验分布,从而能够从经验上评估专家的专业知识。如果专家意见与数据不一致,则N m 将很小,实际上减少了专家对推论的影响。此外,该工程判断使得二项分布似然函数在σ i,m 点具有最大值。这种做法极大降低了所有模型参数的联合分布不一致的可能性,并且还通过将工程判断视为“数据”的形式隐式地处理聚合问题。
接下来,将通过简单例子说明了N 固定和随机之间的差异,如图2所示。在两种情况下,数据为成功次数x ,总试验次数n =40次,似然函数服从二项分布,成功的概率p 未知。p 先验分布为B (Nπ /N (1-π )),π =0.5,比较了N 固定(为30)的情况,以及N 随机的情况,即N 服从参数α =3和β =1/10的γ先验分布(E (N )=30,SD (N )=17.32)。在每副图中,实线是N 固定情况下p 的后验密度估计,虚线是在N 随机情况下p 的后验密度估计。左图为成功次数x =20的情况,这与π =0.5的先验均值完全一致。在这种情况下,数据提供的关于N 的信息不是很多,因此其后验接近于其先验数据。N 的后验平均值为31.96,略大于其先验平均值30,其后验标准差为17.23,与先验标准差17.32大致相同。p 的后验分布均值为0.5,其后验分布SD 在N 固定或随机情况下基本都为0.06。因此,在数据与先验一致的情况下N 可以是随机的,不会造成任何影响。然而,如果数据和先验不一致,则N 固定和随机情况下会得出不同的结果,如图2的右图(x =35)。对于N =50固定的情况,在40次试验中有35次成功,所以可以推断E (p )=0.705 7和SD (p )=0.053 26。当N 是随机变量时,其N 后验分布的平均值为12.27,SD 为8.353 11,p 的先验也显得并不重要,并且得到E (p )=0.782 6和SD (p )=0.068 76;平均值更接近数据所隐含的高可靠性,而标准偏差较大,这是因为先验分布提供的信息较少。对于N 固定的情况,贝叶斯分析具有误导性,因为先验的准确性被高估了,其与数据不一致。而对于N 随机的情况,贝叶斯分析相应地进行处理,将先验作为有用的信息,但不如最初想到的那么准确。
图2 比较N 固定和随机两种情况下p 的后验分布概率密度
建模的目标是使用可用数据来估计每个组件、子系统、整个系统C i 的可靠性参数p i ,重点是获得整个系统C 1的可靠性估计,即p 1。
当关于组件可靠性的先验分布并不总是已知时,专家通常有可能将组件分配到“可靠性类似”的组。给定组中组件的可靠性不一定相同,但可交换。因此,通过假设式(5)中σ i,m 由ρ m,g 代替,其中ρ m,g 表示由专家m 分配给组g 中的组件的共同但未知的可靠性概率,这样可以对模型进行扩展。 此类信息的模型参数先验服从以下公式:
(8)
在贝叶斯推断中,用概率分布刻画模型参数取值的知识,并利用先验分布、可靠性模型和观察数据,通过贝叶斯定理给出参数(或多个参数)的后验分布,连续形式通常可写为:
如式(8)所示,假定参数K m 先验分布服从参数为ζ m 和η m 的γ 分布,组g 的成功概率参数ρ m,g 的先验分布服从参数δ g,m 和ξ g,m 已知的β分布。这里ρ m,g 可以被解释为组g 内的组件p i 的公共平均估计。这种方法可以利用相似的组件的知识,以增加预测能力。
2.4.3 无精确信息
春暖花开,春回燕来。京师气候不比江南,春脖子短,暮春如夏,到处生机盎然。像往年一样,李武岗不踏青,不郊游,只顾关起门来享受。那天,在拔火罐时,赤条条的他居然成为火人。比之已被烧死的李驷峋、李陆峰,李武岗烧得更彻底。据当时在场的仆人说,烧到半途,李武岗早就死去,火苗也已经弱下去,谁知躯干中间部位居然“突突”地喷出烈焰,将胸腹全部点燃,最终整个中段都烧没了,仅剩头颈和四肢。更诡异的是,就连易燃的丝质床单都未全部烧光,卧榻几乎完好无损。
对于有测试数据而无精确专家工程判断信息的组件(终端节点),运用层次贝叶斯模型来描述组件(终端节点)的先验分布。同时,这种层次贝叶斯模型可以使系统可靠性估计对系统事件树图中包含的层次信息并不灵敏。
接下来将通过两个简单的例子来说明层次贝叶斯模型的重要性。在第一个例子中,考虑一个由3个组件串联系统(类似于C 1,由C 2、C 3和C 4组成的简单系统,没有其他组件),并且假设在系统级别观察到4次成功和1次故障。组件先验分布没有使用层次贝叶斯模型。按照上述组件具有共同先验分布的假设,系统可靠性似然函数将与下式成正比:
(p 2p 3p 4)4(1-p 2p 3p 4)
(9)
其中p 1=p 2p 3p 4,组件故障独立、串联,要求所有三个组件都正常系统才正常。似然函数是根据以下事实得到的:由于4次试验成功,意味着组件C 2、C 3和C 4全部工作,其发生概率p 2p 3p 4。故障的概率1-P (成功)=1-p 2p 3p 4。
重庆市民政机关在制度建设、组织保障、人才培养和资金支持等方面大力推动婚姻家庭社会工作标准化的实施和发展。为了更好地解决居民需求,提高服务质量和水平,形成标准服务流程和体系,重庆市婚姻收养登记管理中心(以下简称“重庆市婚管中心”)对居民婚姻家庭进行了多次需求摸底调查,发现居民对婚姻家庭方面的需求主要集中在子女教育、婚姻家庭法律法规知识、结婚及生育法定程序、优生优育、夫妻相处技巧和家庭理财知识等方面(具体情况见图4)。
在第二个例子中,假设组件C 2、C 3和C 4的可靠性不服从独立的均匀分布。相反,每个组件的成功概率服从β分布(如式(5)),参数为Jγ +1和J (1-γ )+1,其中假定参数J 服从参数为τ 和φ 的γ分布。假设参数γ 服从参数为ψ 和ω 的β分布:
Β (p i ;Jγ ,J (1-γ ))
(10)
根据p 2到p 4的层次先验描述,以及ψ =ω =0.5,p 1的后验平均值为0.718,而具有ψ =ω =1.0使得后验平均值为0.687。这两个估计在很大程度上对系统的组件数量不灵敏。这是该模型的一个重要特征,即系统不同组件和子系统数据的可用性不应在系统整体可靠性估计方面产生重要影响。
2.4.4 联合后验分布
海归新生代企业接班人在国外深造时,无法全面、深刻了解中国情境。但当新生代回国后,如何快速融入到中国情境中,有创一代的指引显得特别重要。父母在商场打拼十几年,多则二三十年,经历过各种人情世故,处理过各种生意场上的突发状况,这些经历将能生动地引导新生代快速融入中国情境。父母需要将新生代企业家当成有着新奇想法的孩童,给予耐心的教导。刚回国的新生代企业家对中国情境的概念是模糊的,他们可能会因为不了解中国情境,就盲目地否定企业的管理模式。
为了获得贝叶斯推断所需的后验分布,数据中包含的似然函数信息必须与先验分布中的专家工程判断相结合。后验分布与先验分布乘以似然函数的积成正比。合成来自似然函数和先验的信息,得到模型参数联合后验分布,其与下式成比例:
李白对唐玄宗既心存他分清忠奸贤愚,再次召征自己的幻想,同时又感到无望,于是进入一个幻想世界,幻境中依然是冰塞雪封、阻隔重重,作者借吕尚和伊尹的典故表白理想:无意于固位争宠,一旦建功立业后,便功成身退,乘舟泛海而去。
3.提高农村幼儿园绘本阅读活动的多元化。农村幼儿园老师应灵活使用游戏式、表演式、亲子式等多种绘本阅读模式。幼儿园老师可以根据绘本阅读教材内容来创造性的设计一些趣味性和互动性强的游戏,帮助幼儿更加准确的理解和把握绘本阅读材料角色的感情和特征,活跃幼儿绘本阅读氛围,提高幼儿绘本阅读的注意力以及培养幼儿绘本阅读的兴趣爱好;幼儿园老师可以先让幼儿独立阅读和了解绘本内容,随后让幼儿扮演绘本材料中不同的角色,幼儿相互配合共同完成绘本所讲述的故事,有利于锻炼幼儿的语言表达能力、记忆力以及团结合作能力等等。
[p |x ,n ,σ ,N ,ρ ,K ,γ ,J ,μ ,ν ,α ,β ,ζ ,η ,δ ,ε ,τ ,φ ,ψ ,ω ]∝
(11)
式(11)是参数p 的联合后验分布的表达式,参数p 在表达式的中垂直线的左侧,垂直线表示参数p 依赖模型的其他参数(x ,n ,μ ,N ,ρ ,K ,γ ,J ,σ ,ν ,α ,β ,ζ ,η ,δ ,ε ,τ ,φ ,ψ ,ω )以获得与联合后验分布成正比(∝)的表达式。S 0表示终端节点/组件的集合。
Script to update rate
由先验信息产生的联合后验分布显示出明显的相似之处,但这些参数之间也有重要区别。例如,N m 的值表示专家意见的精度,而K m 描述了分组内组件可靠性的相似性。
3 求解方法
3.1 马可夫链蒙特卡罗
本文中的联合后验分布非常复杂,包含多个分布,所以不能立即对复杂系统可靠性做推理和估计。
海航就是很能够发人深省的案例。海航在前两年国内外的并购市场中,可谓是风头无二,然而自从海航创始人之一的王健在法国意外死亡以后,海航便陷入暗淡。在最近面对媒体的采访中,海航董事长陈峰表示,海航集团的业务板块将调整为“两主+两辅”,做精航空主业。截至目前,围绕这一目标,海航已累计完成3000亿元资产规模的出售,未来还将有第二批、第三批资产出售。陈锋坚定地表示,非主业资产盈利能力再强也不要。
马尔科夫链蒙特卡罗MCMC(Markov Chain Monte Carlo)方法是贝叶斯计算取得的突破性进展,可以通过联合后验分布获得随机样本。MCMC可以在有限维状态空间中模拟由任何非规范化分布密度函数指定的任何的分布。一旦通过MCMC算法获得随机样本,则可以对感兴趣的任何分布特征进行推断。目前常用的MCMC有两种,一种是吉布斯(Gibbs)采样方法[20],另一种方法是 Metropolis-Hastings算法[21]。
目前有许多种运行MCMC的软件。MCMC独立软件包括 winBUGS和openBUGS、JAGS (Just Another Gibbs Sampler,由Martin Plummer等编写和维护)、Stan(Andrew Gelman 编写和维护); R软件的MCMC软件包包括MCMC(Charles Greyer编写和维护)、Nimble(Chris Paciorek 编写和维护)、R语言调用openBUGS、rjags、STAN的软件包。
3.2 OpenBUGS
本文将使用OpenBUGS来进行仿真计算。OpenBUGS(BUGS是Bayesian Inference Using Gibbs Sampling的缩写)是实现MCMC的免费软件,其开源版本可以从www.openbugs.info获得。OpenBUGS采用菜单驱动的脚本语言。这种脚本语言包括三部分:模型描述、数据和初值。模型描述包括似然函数、先验分布和计算量(如系统可靠度)。数据和初值可以写入脚本,也可以从独立文件读入。“#”后文字用作注释[22]。脚本示例:
在这个表达式中,假定非终端结节点概率(如元素C 1、C 2、C 4和C 7)可以根据系统事件树图描述为终端节点概率的适当函数。式(11)的第1行对应于从每个可用组件的观察数据对似然函数的贡献。第2和第3行对应于专家对组件先验分布的精确信息,而第4和第5行对应于组件分组的信息,第6和第7行对应组件(终端节点)缺少精确先验分布信息。
model { #{}间定义模型
events ~ dpois(mu) #事件数服从泊松分布
mu <- lamda*time #泊松分布的参数
随着我国土地流转的加剧和农业现代化、规模化的发展,传统农资行业销售渠道正面临着翻天覆地的改变,厂家渠道贴地下沉,市场竞争不断加剧,新型农业经营主体和新型服务平台的层出不穷,农资企业在业务拓展上受到越来越多的阻力和挑战。如何在新的农业发展形势下拥抱变化、盘活市场成为肥料生产企业亟待破解的难题。
lamda ~ dgamma(2.6,34) #λ的先验分布
}
Data #观察数
List(events=2,time=14)
4 示 例
接下来将运用本文提出贝叶斯推断方法对虚构的复杂系统进行可靠性分析。复杂系统的结构可以用图1的事件树图进行描述。图3对事件树图各个节点的先验分布进行了区分。有3名专家对组件给予工程判断。C 10-C 17有分组信息,即它们有相同的先验分布,与3名专家对应的先验分布参数ζ 、η 、δ 、ε 分别为(2, 3, 4)、(0.1, 0.2, 0.4)、(9, 10, 11)、(1, 1, 1)。C 5、C 6有精确的专家工程判断,C 5与3名专家对应的先验分布参数α 、β 、μ 、ν 分别为(4, 3, 2)、(0.4, 0.2, 0.1)、(20, 15, 10)、(1, 1, 1),C 6与3名专家对应的先验分布参数α 、β 、μ 、ν 分别为(4, 2, 3)、(0.2, 0.1, 0.4)、(15, 10, 20)、(1, 1, 1)。
图3 先验分布类型划分
C 3、C 8和C 9没有精确的先验分布,先验分布参数τ 、φ 、ψ 、ω 分别为1、1、2、2。各组件测试次数分别为1 276、163、182、26、183、127、20、56、110、192、193、32、195、192、98、161、29,成功次数分别为1 260、161、181、25、180、121、19、55、108、190、191、31、191、190、97、160、28。利用OpenBUGS可以实现对该复杂系统可靠性的估计和分析,OpenBUGS脚本如下:
在MCMC仿真计算中,进行了100 000次迭代(舍弃最初10 000次以达到收敛)以估计参数值。
表1给出了各组件的可靠性评估值,系统的可靠性均值、标准差、仿真误差、2.5%分位数、中位数、97.5%分位数分别为0.905 1、0.108 2、0.006 084、0.481 6、0.958 9、0.970 3。图4给出了各组件的盒图,直观地描述了各组件的可靠性范围。可见,系统可靠性偏差范围较大。图5给出了部分组件可靠性密度曲线。图6给出了部分组件的History曲线,可以看出仿真中的马尔科夫链在迭代40 000次后实现了收敛。
表1 各组件可靠性评估值
图4 复杂系统各组件盒图
(a)p 1的后验分布密度(b)p 2的后验分布密度
(c)p 3的后验分布密度(d)p 4的后验分布密度
图5 复杂系统部分组件可靠性估计密度曲线
(a)p 1采样曲线 (b) p 2采样曲线
(c)p 3采样曲线 (d) p 4采样曲线
图6 复杂系统部分组件History曲线
在实例中全系统测试数据较为充分,实验进行了1 276次,其中1 260次成功,组件的测试相对较少,介于0到200之间。根据表1,系统可靠性仿真结果为0.970 3,与实验的0.987 4(1 260/1 276)接近,也验证了贝叶斯方法在数据充分的时候与传统概率论得出的结论是一致的。通过对模型的仿真计算,验证了该方法可以有效地融合全系统测试数据、组件和子系统级测试数据和专家工程判断,可以根据可用的数据灵活选择建模粒度,一致性地估计组件、子系统、系统的可靠性参数。
5 结 语
随着武器装备系统日益复杂,成本越来越高,大量的全面系统测试逐渐变得不可行,很难得到大量的可靠性信息,可靠性的统计分析与评估面临着挑战。因此,本文提出了一种基于贝叶斯推断的复杂系统可靠性分析方法。首先,介绍了贝叶斯推断原理和一般步骤。其次,利用事件图对复杂系统结构进行建模,归纳了可用的数据类型,对组件随机模型和先验分布进行描述。再次,探讨了如何利用马尔科夫蒙特卡洛方法对模型进行求解。最后,给出了复杂系统实例,利用OpenBUGS对其进行建模和仿真计算,验证了方法的可行性与有效性。本文提出的方法可以灵活地融合组件和子系统级测试数据、专家工程判断和全系统测试数据,可以根据可用的数据灵活选择建模粒度,一致性地估计组件、子系统、系统的可靠性参数。今后,还可以将这种方法拓展到具有更复杂可靠性关系的系统、多状态系统,融合更多类型的先验知识,如物理化学等理论知识、工程试验或验收试验的结果、行业通用的可靠性数据、计算分析结果、相似产品数据等。
参考文献
[1] Martz H F, Waller R A. Bayesian reliability analysis[M]. New York: Wiley,1982.
[2] Hamada M S, Wilson A, Reese C S, et al. Bayesian reliability[M]. New York: Springer Science & Business Media, 2008.
[3 ] Kelly D, Smith C. Bayesian inference for probabilistic risk assessment: A practitioner's guidebook[M]. New York: Springer Science & Business Media, 2011.
[4] Martz H F, Wailer R A, Fickas E T. Bayesian reliability analysis of series systems of binomial subsystems and components[J]. Technometrics, 1988, 30(2): 143-154.
[5] Martz H F, Wailer R A. Bayesian reliability analysis of complex series/parallel systems of binomial subsystems and components[J]. Technometrics, 1990, 32(4): 407-416.
[6] Tang J, Tang K, Moskowitz H. Bayes credibility intervals for reliability of series systems with very reliable components[J]. IEEE transactions on reliability, 1994, 43(1): 132-137.
[7] Tang J, Tang K, Moskowitz H. Exact Bayesian estimation of system reliability from component test data[J]. Naval Research Logistics (NRL), 1997, 44(1): 127-146.
[8] Soman K P, Misra K B. On Bayesian estimation of system reliability[J]. Microelectronics Reliability, 1993, 33(10): 1455-1459.
[9] Johnson V E, Moosman A, Cotter P. A hierarchical model for estimating the early reliability of complex systems[J]. IEEE Transactions on Reliability, 2005, 54(2): 224-231.
[10] Hamada M, Martz H F, Reese C S, et al. A fully Bayesian approach for combining multilevel failure information in fault tree quantification and optimal follow-on resource allocation[J].Reliability Engineering & System Safety,2004,86(3): 297-305.
[11] Reese C S, Wilson A G, Guo J, et al. A Bayesian model for integrating multiple sources of lifetime information in system-reliability assessments[J]. Journal of quality technology, 2011, 43(2): 127-141.
[12] Graves T L, Hamada M S, Klamann R, et al. A fully Bayesian approach for combining multi-level information in multi-state fault tree quantification[J]. Reliability Engineering & System Safety, 2007, 92(10): 1476-1483.
[13] Wilson A G, McNamara L A, Wilson G D. Information integration for complex systems[J]. Reliability Engineering & System Safety, 2007, 92(1): 121-130.
[14] 王智明, 杨建国. 少样本故障数据数控机床的贝叶斯可靠性分析[J]. 中南大学学报(自然科学版), 2014, 45(12): 4201-4205.
[15] 肖辽亮. 基于贝叶斯理论的光纤陀螺光源可靠性评估[J]. 电子设计工程, 2016, 24(15): 146-148.
[16] 彭卫文, 黄洪钟, 李彦锋, 等. 基于数据融合的加工中心功能铣头贝叶斯可靠性评估[J]. 机械工程学报, 2014, 50(6): 185-191.
[17] Roberts N H. Fault tree handbook[M]. Washington D.C.: United States Government Printing, 1987.
[18] Rausand M, Hoyland A. System reliability theory: models, statistical methods, and applications[M]. New York: Wiley, 2004.
[19] Guarro S, Yau M. On the nature and practical handling of the Bayesian aggregation anomaly[J]. Reliability Engineering & System Safety, 2009, 94(6): 1050-1056.
[20] Casella G, George E I. Explaining the Gibbs sampler[J]. The American Statistician, 1992, 46(3): 167-174.
[21] Chib S, Greenberg E. Understanding the metropolis-hastings algorithm[J]. The American Statistician, 1995, 49(4): 327-335.
[22] Spiegelhalter D, Thomas A, Best N, et al. OpenBUGS user manual, version 3.2.3[R/OL]. Cambridge: MRC Biostatistics Unit, 2007[2018-06-20]. https://www.mrc-bsu.cam.ac.uk/software/bugs/openbugs/.
RELIABILITY ANALYSIS OF COMPLEX SYSTEM BASED ON BAYESIAN INFERENCE
Su Xujun1 Lü Xuezhi2
1(Army Engineering University ,Shijiazhuang Campus ,Shijiazhuang 050003,Hebei ,China )2(Ninth Comprehensive Training Base of Army ,Xuanhua 075100,Hebei ,China )
Abstract With the increasing complexity of weapons and equipment systems and higher costs, comprehensive system testing has become increasingly infeasible. It is difficult to obtain a large amount of reliability information. Statistical analysis and evaluations of reliability are facing challenges. In order to solve the problems, we proposed a reliability analysis method for complex systems based on Bayesian inference. Bayesian inference and complex reliability analysis steps based on Bayesian inference were introduced. Event tree diagrams were used to model the complex system structure, the available data types were summarized, and the random component model and prior distribution were described. Then, we discussed how to use the MCMC (Markov Chain Monte Carlo) method to solve the model. A calculation example was constructed to verify the feasibility and validity of the method. The proposed method can flexibly integrate component and subsystem level data, expert knowledge, and system-wide test data. It is applicable to different modeling granularity and can consistently estimate the reliability parameters of components, subsystems and systems.
Keywords Bayesian inference Complex system Reliability analysis MCMC OpenBUGS
收稿日期: 2018-09-22。
国家自然科学基金项目(U1435218);中国博士后科学基金项目(2017M613360);军内装备科研项目(012016012600B12507)。
苏续军 ,讲师,主研领域:维修工程。吕学志 ,讲师。
中图分类号 TP391.9
文献标识码 A
DOI:10.3969/j.issn.1000-386x.2019.03.040
标签:贝叶斯推断论文; 复杂系统论文; 可靠性分析论文; 马尔科夫链蒙特卡罗论文; OpenBUGS论文; 陆军工程大学石家庄校区论文; 陆军第九综合训练基地教研部论文;