随机估计和VDR检验,本文主要内容关键词为:VDR论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
0 引言
首先考虑一维参数的推断问题。所谓一维参数假设检验问题,是指假设涉及的参数是一维的,可以是分布参数的分量。为问题明确,将总体分布或密度函数写作
关于假设(1),λ是冗余参数。
关于参数η统计推断,众所周知有三种理论:频率学派,Fiducial推断和Bayes推断。现在普遍接受的Neyman理论,称为频率学派。认为未知参数是常数,用统计量推断参数,包括点估计、置信区间和假设检验。Fiducial推断和Bayes推断都是以概率分布推断参数。认为参数是随机变量,统计推断就依据参数的分布,分别称作Fiducial分布和后验分布。两者求法不同,而推断参数的方法一致,称为分布推断。通常认为他们的推断机制是不同于Neyman理论的。
随机估计源于Fisher的信仰推断,是经典统计的概念。Fisher提出的信仰推断(Fiducial inference)是用信仰分布推断参数。什么是信仰分布?Fisher于1930年,在他的“Inverse probability”一文中作为挑战Bayes的后验分布而提出信仰分布概念。设F(.,θ)是随机变量X的分布函数,概率密度函数是f(.,θ)。给定x,Fisher定义信仰分布密度函数为
该公式也适用于基于枢轴量计算参数的信仰分布密度函数。
h(x,η)是定义在×N上,取值于N上的函数。对给定η,h(X,η)的分布函数Q(·)与参数η,λ无关,对给定样本x,h(x,·)是N→N的单调函数,则称h(x,η)是参数η的枢轴量。Q(·)的概率密度函数记作q(·)。Fisher认为η是随机变量,其分布密度函数是
公式(2)或(3)的导出有两步:
1.确定枢轴量h(X,η)的分布时η是常数参数,X是随机变量;
2.求信仰分布密度函数时又认为η是随机变量,样本为x是常数。
参数η是常数还是随机变量?这就是所谓Fisher疑惑。若η是随机变量,h(x,η)=V~Q(·),公式(3)是正确的。只是导出随机变量V的分布时η是常数,导出信仰分布时又成了随机变量。既然存在逻辑上的不一致为什么信仰推断至今还是研究热点之一?除是大师Fisher提出的概念外,还因为在众多情形下信仰推断结果和经典结果一致;有些经典统计难题,容易用信仰推断来解决,如Behrens-Fisher问题。对正态总体经典推断和信仰推断结果是一致的。为消除逻辑上的疑惑,引进随机估计概念。用随机变量估计(常数)参数η,叫做参数η的随机化估计或就叫随机估计,它应满足
V=b(x,),V~q(·),(4)
的密度函数由(3)给出。随机估计是取值于参数空间的随机变量,其分布依赖于样本。它不同于统计量,统计量是样本的函数,其分布依赖于参数。当存在参数的充分统计量时样本可用充分统计量代替。
Neyman理论核心观点认为参数是未知常数,用统计量估计参数,无论点估计还是区间估计都是随机变量。是容易被人接受的符合常理的观点。而Fiducial推断和Bayes推断都将参数看作随机变量。无论哪种推断,都认为在观测样本时参数是不变的。初看起来,Neyman理论与Fiducial推断和Bayes推断完全不同。但是,三种理论是有内在联系的,换一个视点看Neyman理论,三种推断参数方式的一致性就出现了,Neyman理论参数推断也可视为分布推断,仅有看待参数观点上的差异。
参数的点估计、置信区间和假设检验是统计推断的基本内容,即使比简单样本更复杂的数据,不管多么复杂的统计模型的观测数据,都要研究这些内容。这些内容是相互关联的,相互确定的。点估计可以视为置信区间的特例。通常认为经典统计、信仰推断和Bayes推断是不同的。换一种观点看经典统计,亦看作分布推断。以下讨论经典推断的分布推断特性。通常将置信上界看做置信度的函数,如果将两者地位互换,就可发现三种推断方式的共性。对任意给定的x,设枢轴量h(x,η)是η的单增函数。η的置信度为γ的置信上界=(x,γ)由下式确定:
由它可导出μ的经典推断。Neyman提出CD概念,作为对1930年Fisher提出的信仰分布(Fiducial Distribution)的解释。尽管CD概念由来已久,近年来作为频率学派的概念重新研究,新瓶装旧酒,作为推断方法加以发展。如前所述,用它代替点估计和区间估计等统计推断。有影响的工作或学者有Efron(1993,1998),Fraser(1991,1996),Lehmann(1993),Schweder和Hjort(2002),认为CD是频率学派的后验分布,是以后统计研究的重点。研究成果清楚表明经典推断也是分布推断。K.Singh,Xie M.G.and W.E.Strawderman(2007)的文章,关于CD做了详尽全面论述,还试图将CD概念推广到多维。在这个意义上讲,经典统计,信仰推断和贝叶斯分析都是用分布函数做推断的。Bayes推断用后验分布,信仰推断用信仰分布(Fiducial Distribution),经典统计用经典推断分布或CD,分布推断是三者的共同点。可以说CD是信仰分布的扩展。设是样本空间,N是参数空间。H(x,·)是定义在×N上,取值于[0,1]上的函数,且满足条件:对给定样本X=x,H(x,·)是N上的分布函数;对给定η∈N,H(X,η)~,其中X~(·,η,λ),则称H(x,·)是一CD。
一般地讲,基于枢轴量的经典置信区间和假设检验规则和基于同一枢轴量产生的随机估计的置信区间和假设检验规则是一致的。能否将CD推广到多维参数?这是众多学者关心的问题。枢轴量推广到多维参数并不难,关键要有处理多维枢轴量的工具。VDR恰是处理多维枢轴量的有效工具。
本文基于随机估计的概率密度函数讨论参数假设检验,提出了VDR检验。第1节讨论枢轴量和VDR检验。第2节应用VDR检验得到一维参数检验,给出正态总体方差检验的最短置信区间。第3节讨论VDR检验在线性变换分布族中的应用,并给出正态总体下的一些结果。第4节展望发展前景。
1 多维参数的随机估计和VDR检验
所谓多维参数假设检验问题,是指假设涉及的分布参数是多维的,可以是分布参数向量或其部分分量。设总体X是p维随机向量,p≥1是常整数。将总体密度函数写作
关于假设(9),λ是冗余参数。
1.1 接受域和拒绝域
1.2 枢轴量
仅当h(χ,η)是η各分量的增函数时才有,
一般情形下,或者可使枢轴量满足
1.3 VDR检验
确定接受域的方法很多,如常用的似然比检验。这里提出一种通用方法,VDR检验。令
1.3.1 分位点计算
1.3.2 接受域和置信域
上式意味着
引理1.1得证。
利用假设检验和置信域的关系,可导出参数η的置信域。置信度为1-α,参数η的置信域为
称其为置信度1-α的VDR置信域或VDR置信集。
事实上,由(17)式,
证明 类似引理1.1的证明。
VDR检验是构造检验的一般原则,应用到经典问题就得到熟知的结果,有时会得到更深刻结果。尤其是可应用到任何研究领域。
2 一元参数的VDR检验
2.1 正态总体均值和方差的检验
这和通常用t分布确定拒绝域是一致的。
2.2 指数分布参数的置信区间
指数分布有用失效率参数表示和平均寿命参数表示两种方法:
考虑假设
这里仅将VDR检验应用到一维总体的参数检验的几个例子,已经看到或得到熟知的结果,或者给出更深刻的结果,还有应用潜力。对多元总体将在后一节论述。可以应用到回归分析、时序分析、多元统计分析,甚至应用到质量控制图及建立多指标质量控制图等。
2.3 位置刻度参数分布族
设F(·)是分布函数,其概率密度函数f(·)在上是连续可微、绝对可积的,期望为0。称随机变量X属于由F生成的位置刻度分布族,若它的密度函数是
当f(·)满足条件
3 多元线性变换分布族及其参数推断
位置刻度分布族推广到随机向量就是多元线性变换分布族。
3.1 多元线性变换分布族
对于正态分布和椭球等高分布已有成熟方法,我们现就一般情况讨论该问题。
应用此公式和行列式对数求导公式于对数似然函数求导,就得到(33).
3.2 多元t分布
对多元正态分布W(x)=x,(36)成为
由下面的引理3.3
引理得证。
3.3 多元正态分布的参数检验
3.3.1 均值向量的检验问题
分两种情形讨论:
1.∑已知
参数μ的枢轴量是
这和似然比检验结果一致。
2.∑未知
首先构造检验假设(42)的枢轴量,它只能含参数μ,不可含参数∑。在正态假设下,似然方程为
及V的密度函数是
3.3.2 协方差阵检验问题
现在考虑假设(43)的检验问题。协方差阵Σ的枢轴量是
将μ和∑的枢轴量合起来就是(μ,∑)的枢轴向量,且两分量相互独立,不难构造检验假设(44)的统计量。这时也只能用模拟分位点。
4 待研究问题
VDR检验是一普遍适用的检验方法。进一步研究问题有理论问题,也有实际应用问题。任何模型的参数检验问题都可用VDR检验处置。
1.有误差项统计模型扩展
像回归分析等模型,包含误差项,通常认为误差项是正态的,否则很多检验方法失去理论根据。有了VDR检验,将正态误差换成刻度分布族,f(·)已知,刻度参数σ是未知参数。对于实际问题,很可能一类问题对应一个f(·)。总的原则,研究方法已经提供,细节有待研究。
2.多响应Logistic回归研究
杨振海,程维虎(2006),Weihu Cheng and Zhenhai Yang(2008)利用VDR给出了多元Logistic分布的构造,利用其结果可进一步讨论多响应Logistic回归模型的构造、检验及其应用问题。研究结果可应用于诸多领域。
3.质量控制图
质量控制图是质量管理中的重要方法,对多指标质量控制尚无成熟方法,可用VDR检验实现多指标质量控制。设一产品质量由m个指标,…,描述。这些指标的概率密度函数是f(x),则可用f(,…,)的大小控制产品质量,其值过小是失控前兆。m=1就得到休哈特质量控制图。
4.非正态多元统计分析
多元统计分析可以说主要是多元正态的分析,对非正态数据办法很少。VDR检验和随机估计提供了有力工具,使研究非正态数据分析成为可能。粗的思路虽有,细节有待研究,到实用的路还很长。结合是具体问题会对应一分布密度函数,就像展开正态数据分析一样的工作。
5.一些具体的参数检验问题
对一些有意义的具体问题如何做,如多总体期望相等的检验,方差齐性等问题。