检验统计量的选择,本文主要内容关键词为:,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
引言
设是来自分布函数F(x)的独立同分布样本,检验该样本是否来自某个分布是统计推断中的重要问题,即检验假设
对于简单假设,在已有的文献中,根据不同的检验构造想法产生了很多检验统计量。如基于实际频率与理论频率之差构造的重要的统计量;基于经验分布函数构造的Kolmogorov统计量(KS,1933),Cramer Von-Mises统计量(CV,1928,1931)和Anderson-Darling统计量(AD,1952)等;基于似然比思想的似然比检验统计量如Berk-Jones统计量(BJ,1979),Zhang(2001)给出的三个似然比统计量和Einmahl-Mckeague统计量(EM,2003)等。与上述文献相同,本文的假设检验问题的判决规则是当检验统计量的观测值较大时拒绝原假设。
一般地,设为n个检验统计量。我们知道,检验统计量的一个选择标准是根据检验的势来进行判定,检验的势越大,该检验越好。已有的知识是:一般情况下,对于上述原假设不存在一致最优势检验。即在不同的备择下,各检验统计量的检验势是不同的,检验的势互有优劣。实际工作者可能不希望在做检验前,先将各统计量的检验势计算出来,然后选择检验势比较高的统计量作为检验统计量。一方面实际中计算检验势可能对实际工作者会遇到统计计算方面的问题;另一方面没有文献能罗列出在所有有用的原假设和备择假设下,各统计量的检验势的比较结果让实际工作者去查用,实际上也不现实。提供一个简捷的检验统计量的选择标准,让实际工作者能比较方便地作出选择,是本文研究的目的。
一、众数与统计量的选择标准
对于连续型随机变量,众数描述的是其概率密度取最大值的点,其周围的点相对是密集的,也即随机变量落在包含众数的区间应该概率较大。我们的想法是用众数来构造能表示概率转换速度的量作为选择标准。关于众数的研究已有很长的时间,其估计的方法大致有三种:一是利用核估计的方法首先估计出随机变量的密度函数,然后再利用优化方法估计出众数,见文献[6,7,8];二是直接通过样本数据构造统计量来估计众数的方法,见文献[9];三是通过Bayes方法来求解众数,见文献[10]。本文从实际的角度出发,选择文献[9]给出的直接利用样本来估计众数。即
文献[9]证明了该统计量是众数的相合估计,文献[10]用Monte Carlo方法例证了(2)是众数较有效的估计量,其中参数k、p的选择见文献[10]。本文选取k=5,p=2。
一个好的检验统计量,就是在相同的原假设下,对于某个备择假设,其检验的势比较高。如统计量的密度函数是单峰的情形,从直观上来看就是在原假设下统计量的取值落在接受域的点,在备择假设下统计量的取值落在了拒绝域内的比较多。即接受域的点流失到拒绝域中多,在同样的基本假设下,流失的速度越快,其检验的势就越高。我们选用:原假设下统计量的众数与临界值的距离与备择假设下统计量的众数与临界值的距离比,及统计量在备择假设和原假设下的众数差与原假设下统计量的标准差之比分别作为刻画原假设换成备择假设后概率的流失速度,流失越快,说明检验的势越高。具体步骤如下:
下面通过例子和Monte Carlo数值模拟来验证其可用性。
二、例子和Monte Carlo数值模拟
例 在上述参数的假定下,Kolmogorov统计量、Cramer Von-Mises统计量、Anderson-Darling统计量、Berk-Jones统计量和Einmahl-Mckeague统计量在显著性水平α=0.05下的临界点和检验的势见表1、表2和表3,通过数值模拟得到的各统计量的概率流失速度值见表4和表5。
从表2~表5可以得到:
(1)当备择假设是Lehmann带时,对于n=10的情形,c=0.3、2.4、3对应的概率流失速度r和R的最大者对应的检验势最高(c=2.4对应的负值中的最大者)。而c=0.6、1.2、1.8分别对应的概率流失速度r和R的最大者对应的检验势不是最高,进一步,按照上界型统计量和积分型统计量来分,在每一类中结论仍然成立。对于n=30的情形,除了c=1.2的最大概率流失速度对应的检验势不是最高外,其他5种备择均满足。另一方面,从表2可以看出,在n=10和n=30两种情形下,五个统计量的检验势差别不大。
(2)当备择假设是Beta(a,b)分布时,对于n=10的情形,除Beta(1.2,2.2),Beta(2.0,1.2)分别对应的概率流失速度r和R的最大者对应的检验势不是最高外,其他的情形均满足。进一步,按照上界型统计量和积分型统计量来分,在每一类中结论仍然成立。对于n=30的情形,6种备择均满足。
(3)在选择的备择中,当,Beta(2.2,2.8)时,模拟得到概率流失速度r和R的大小按照由大到小排序的结果分别与各检验的势的排序结果是一致的。
三、结论
本文通过数值模拟例证,得到了两个用来选择检验统计量的较为简单的选择标准——概率流失速度。从模拟的结果来看是可用的,对于复合假设,可以利用样本用Bootstrap方法模拟其统计量的密度函数,利用文[11,12]的递归核估计方法求解检验统计量的众数,再用本文的方法选择。
表1 各检验统计量在α=0.05,样本容量为n,下的1-α分位点
表2 各检验统计量的势p,α=0.05,样本容量为n
表3 各检验统计量的势p,α=0.05,样本容量为n
表4 各检验统计量的概率流失速度r和R,α=0.05,样本容量为n
表5 各检验统计量的概率流失速度r和R,α=0.05,样本容量为。