无失效数据问题给统计学带来的“麻烦”,本文主要内容关键词为:统计学论文,麻烦论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:O212.1文献标识码:A
一、无失效数据问题简介
随着科学技术的发展,统计学的应用越来越广泛,但在实际问题中的一些问题也常常给统计学带来麻烦,如何看待这些“麻烦”呢?本文将介绍无失效数据问题,并将指出无失效数据问题给统计学带来的“麻烦”。
对一些高可靠性产品,要想获得其失效数据,不仅花费很长的试验时间,而且对价格昂贵产品的破坏性也是令人难以忍受的。所以对无失效数据的研究,越来越引起了国内外学者的重视。在可靠性试验中,常会得到各种截尾数据,在定时截尾可靠性试验中,有时会遇到无失效数据,特别是在高可靠性、小样本问题中,更容易产生无失效数据。对无失效数据的研究是近年来遇到的新问题,这项工作具有理论和实际应用价值。可靠性统计中的“无失效数据问题”,对于建立在失效数据分析基础上的现有可靠性统计理论来说,是一个有一定难度的问题。自从Martz和Waller(参考文献[1])发文以来,对无失效数据的研究已有20多年的历史了,现在已引起国内外的重视,并且已取得了一些成果。关于无失效数据的研究进展情况,见参考文献[2,3]。
以上提出了可靠性统计中的“无失效数据问题”,那么类似于可靠性中的“无失效数据问题”,在统计学的其他分支领域中是否也存在呢?本文将肯定地指出:在证券投资预测、Logistic回归等领域中,也存在类似于可靠性统计中的“无失效数据问题”,并且这些“无失效数据问题”给统计学带来了不少“麻烦”。人们为了解决这些“麻烦”做出了各种努力,这在客观上起到了促进统计学发展的作用。
二、可靠性统计中的“无失效数据问题”
研究无失效数据问题最早的文献,要算Martz和Waller(见参考文献[1])。在此以前人们虽然也遇到过类似的问题,但嫌处理它太“麻烦”而作为异常数据被剔除了。随着科学技术的进步,产品的质量不断提高,在定时截尾可靠性试验中,常会遇到无失效数据。可靠性中的“无失效数据问题”给统计学带来了不少“麻烦”,人们为了解决这些“麻烦”做出了各种努力。
对某产品进行m次定时截尾试验,截尾时间为,相应试验样品数为,2,Λ,m。若试验的结果是所有样品无一失效,则称为无失效数据[也称为“零失效数据”(zero-failuredata)]。
设某产品的寿命服从指数分布,其密度函数为f(t)=λexp(-λt),其中t>0,λ>0,λ为指数分布的失效率。根据参考文献[4],可得失效率极大似然估计为=r/s(t),其中r为在截尾时间段内产品的失效个数,s(t)为截尾时间段内的总试验时间。则平均寿命θ的极大似然估计(MLE)为。对无失效数据情形,即r=0,于是平均寿命θ的极大似然估计为。
这说明,在无失效数据情形,平均寿命θ的极大似然估计为无穷大(即此时极大似然估计不能收敛)。这个结果显然是不合理的,这说明在无失效数据情形,极大似然估计法已经不能适用。这样“无失效数据问题”就给统计学带来了“麻烦”,人们为了解决这个“麻烦”做出了各种努力。下文简要介绍解决这些“麻烦”的近似极大似然估计(AMLE)法、修正极大似然估计(MMLE)法等:在参考文献[5]中,提出了近似极大似然估计法。把无失效数据嵌入到齐次Poisson过程这个框架中去,使无失效数据转化为过程的年龄信息。再借助Poisson过程中年龄过程的多维生存分布函数的Lebesgue分解式以及伪样本估计法,导出了指数分布(1)中失效率的近似似然方程,并在此基础上给出了失效率的近似极大似然估计(AMLE)。所给出的数值模拟例子说明:近似极大似然估计(AMLE)法具有合理性和有效性。
在参考文献[6]中,提出了修正极大似然估计法。该方法的实质是给出在无失效数据情形下修正似然函数,并在此基础上给出指数分布、Weibull分布下,分布参数的修正极大似然估计。在参考文献[7]中,根据参考文献[6]的修正极大似然估计法,给出了双指数分布的修正似然函数,在此基础上给出了双指数分布的参数的修正极大似然估计,并结合某型发动机的实际问题进行了分析和计算。
三、证券投资预测中的“无效数据问题”
设是来自同一个总体的n个观察值,根据需要把它们进行统计分组,并划分对象所处的状态,即把n个观察值按一定的间距进行分组,分成K组(1<k<n),相应地把预测对象划分为k个状态,第i个状态记作个观察值(i=1,2,Λ,k)。
把
五、结束语(略)