基于期望的重要抽样方法研究,本文主要内容关键词为:方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
引言
稀有事件是一种发生概率低但后果严重的事件,如亚洲金融危机,东南亚大海啸等。上世纪六、七十年代,美国的核电厂在进行安全性分析时,最先涉及到对稀有事件的风险评估[1]。随后在化学工业、环境保护、航天工程、医疗卫生、交通运输、经济等领域得以推广和应用[4~7]。虽然,稀有事件的发生概率比较低,但一旦发生就会造成严重的后果,对人类的生产和生活产生巨大的影响。这些成了推动稀有事件相关学科兴起和发展的主要动力,关于稀有事件的决策问题的研究受到很高的重视。在针对稀有事件问题的决策中,一个非常关键的问题就是对事件发生的可能性加以科学估计,它是决策的基础和前提。目前,大部分稀有事件风险评估多集中于定性分析层面,由于稀有事件发生机理的复杂性和发生模式的多样性,定量化分析的难度很大。因此稀有事件的定量化分析具有重要的理论和现实意义[1~3]。
应用仿真技术可以更加直观地分析不确定性因素的表现形式和后果。也就是说,通过在仿真过程中模拟影响重大的稀有事件的发生及其发生后的系统运行情况,监测运行中性能测度的变化,能够有效地评估此类稀有事件对系统性能的影响,进而寻找可行的解决办法。传统的Monte Carlo仿真(MCS)方法在估计稀有事件发生的概率时,需要进行数目庞大的仿真实验,只有这样才有可能得到有价值的结果,而这往往超过了计算机的承受能力[3,8]。重要抽样(Importance Sampling,IS)技术可以很好地解决这个问题[3]。重要抽样的主要思想是通过尺度变换(Change of Measure,CM)来修改决定仿真输出结果的概率测度,使本来发生概率很小的稀有事件频繁发生,从而加快仿真速度,在较短的时间内得到稀有事件[2]。
本文提出一种基于期望的解决稀有事件概率估计的方法——应用判断抽样密度函数与最优重要抽样分布函数的期望是否为1来实现重要抽样的方法。这种方法通过极小化抽样密度函数与最优重要抽样分布函数的期望与1之间的距离,进而从分布族{f(·;v)}中确定参数向量v来选取一个密度函数,使与f(·;v)距离最近,最后得到稀有事件的概率估计。本文还将该方法应用在项目进度管理问题中,并与Monte Carlo仿真(MCS)方法进行比较。
一、重要抽样
重要抽样技术利用修改了的概率密度函数进行抽样,得到以较高概率出现的样本,然后通过对其输出结果加权来补偿由修改密度函数带来的偏差。按这种思路,可以在较短的时间内得到稀有事件[9]。
(一)稀有事件
三、仿真示例
下面以项目管理中的一类稀有事件为例来说明本文算法的有效性。在某项工程中,关键路线上共有5个关键活动。令x表示每一个活动的工时,s(x)表示这项工程总的完工期,所以s(x)是5个变量的和。本文所考虑的问题是总的完工期大于一个给定时间r的事件(s(x))>r)的概率,即需要估计l=P(s(x)>r)。当r>r*时,(s(x)>r)是一个稀有事件,此处r*=arg(P(S(x)>r)=。在不影响算法有效性的前提下,考虑每项活动的工时分别服从均值为μ=25的指数分布的情况。本文对给定的两个r值500和800进行仿真,表1、表2显示了仿真结果。表中是l的估计量,N是仿真次数,90%H.W.表示90%置信区间半长。使用基于期望的重要抽样方法估计l=P(s(x)>r),其结果列于表2。本文同时用标准的Monte Carlo仿真方法来估计l=P(s(x)>r),结果列于表1。由于仿真试验具有随机性,所以对每种情况独立做了100次仿真试验,表中数据均取自100次独立试验的平均值。
由表1和表2的对比不难看出,当r=500时,传统的Monte Carlo仿真算法需要进行200000次仿真实验才可以得到置信区间半长为3.2800e-006的估计量;而基于期望的重要抽样方法在进行1000次仿真实验后就可以得到置信区间半长为5.4580e-006的估计量,计算时间大大减少。当r=800时,传统的Monte Carlo仿真算法进行5000000次仿真实验后,仿真不到稀有事件。而本文提出重要抽样方法在分别进行3000次仿真实验后,得到了令人满意的结果。可见本文提出的方法对于小概率事件的计算精度高于其他几种方法,所以对于稀有事件来说,本文提出的方法的计算结果更可靠。
表1 基于Monte Carlo方法估计稀有事件的概率
注:表中的“-”表示经过了5000000次抽样后,稀有事件没有发生,以至于无法建立有效的区间估计。
表2 基于期望的重要抽样方法估计稀有事件的概率
以上分析显示出本文算法与传统的Monte Carlo仿真算法相比,仿真效率有明显提高。很显然,对于小概率事件传统的Monte Carlo仿真方法无能为力,但是本文算法仍然可以在较少的仿真次数下得到理想的结果。由此验证了本文提出的方法对于计算稀有事件概率这类问题的有效性。
四、结论
本文通过判断待确定的抽样密度函数与最优重要抽样密度函数的比值期望是否为1的思想,提出了一种新的基于期望的重要抽样方法。该算法将期望与重要抽样算法相结合,通过极小化抽样密度函数与最优重要抽样密度函数的比值的期望与1之间的距离,来选取重要抽样分布函数,再根据最优重要抽样分布函数生成样本,得到稀有事件概率的估计量。并将仿真结果与标准的Monte Carlo仿真方法进行比较,结果显示出本文算法在估计稀有事件概率方面的有效性。
稀有事件仿真方法的研究主要有交叉熵方法和极小化方差的方法[5],因此在理论方面还存在着广阔的发展空间。理论方面如初值的选取和如何在仿真中应用方差衰减技术都需要进行更深入的研究。另外,该方法可用于经济危机和金融预警等领域的分析。在方法的改进上,可以考虑和其他的方差衰减技术相结合,以期构成更加有效的稀有事件仿真方法。