随机估计与VDR检验_随机变量论文

随机估计和VDR检验，本文主要内容关键词为：VDR论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

0 引言

首先考虑一维参数的推断问题。所谓一维参数假设检验问题，是指假设涉及的参数是一维的，可以是分布参数的分量。为问题明确，将总体分布或密度函数写作

关于假设（1），λ是冗余参数。

关于参数η统计推断，众所周知有三种理论：频率学派，Fiducial推断和Bayes推断。现在普遍接受的Neyman理论，称为频率学派。认为未知参数是常数，用统计量推断参数，包括点估计、置信区间和假设检验。Fiducial推断和Bayes推断都是以概率分布推断参数。认为参数是随机变量，统计推断就依据参数的分布，分别称作Fiducial分布和后验分布。两者求法不同，而推断参数的方法一致，称为分布推断。通常认为他们的推断机制是不同于Neyman理论的。

随机估计源于Fisher的信仰推断，是经典统计的概念。Fisher提出的信仰推断（Fiducial inference）是用信仰分布推断参数。什么是信仰分布？Fisher于1930年，在他的“Inverse probability”一文中作为挑战Bayes的后验分布而提出信仰分布概念。设F（.，θ）是随机变量X的分布函数，概率密度函数是f（.，θ）。给定x，Fisher定义信仰分布密度函数为

该公式也适用于基于枢轴量计算参数的信仰分布密度函数。

h（x，η）是定义在×N上，取值于N上的函数。对给定η，h（X，η）的分布函数Q（·）与参数η，λ无关，对给定样本x，h（x，·）是N→N的单调函数，则称h（x，η）是参数η的枢轴量。Q（·）的概率密度函数记作q（·）。Fisher认为η是随机变量，其分布密度函数是

公式（2）或（3）的导出有两步：

1.确定枢轴量h（X，η）的分布时η是常数参数，X是随机变量；

2.求信仰分布密度函数时又认为η是随机变量，样本为x是常数。

参数η是常数还是随机变量？这就是所谓Fisher疑惑。若η是随机变量，h（x，η）=V～Q（·），公式（3）是正确的。只是导出随机变量V的分布时η是常数，导出信仰分布时又成了随机变量。既然存在逻辑上的不一致为什么信仰推断至今还是研究热点之一？除是大师Fisher提出的概念外，还因为在众多情形下信仰推断结果和经典结果一致；有些经典统计难题，容易用信仰推断来解决，如Behrens-Fisher问题。对正态总体经典推断和信仰推断结果是一致的。为消除逻辑上的疑惑，引进随机估计概念。用随机变量估计（常数）参数η，叫做参数η的随机化估计或就叫随机估计，它应满足

V=b（x，），V～q（·），（4）

的密度函数由（3）给出。随机估计是取值于参数空间的随机变量，其分布依赖于样本。它不同于统计量，统计量是样本的函数，其分布依赖于参数。当存在参数的充分统计量时样本可用充分统计量代替。

Neyman理论核心观点认为参数是未知常数，用统计量估计参数，无论点估计还是区间估计都是随机变量。是容易被人接受的符合常理的观点。而Fiducial推断和Bayes推断都将参数看作随机变量。无论哪种推断，都认为在观测样本时参数是不变的。初看起来，Neyman理论与Fiducial推断和Bayes推断完全不同。但是，三种理论是有内在联系的，换一个视点看Neyman理论，三种推断参数方式的一致性就出现了，Neyman理论参数推断也可视为分布推断，仅有看待参数观点上的差异。

参数的点估计、置信区间和假设检验是统计推断的基本内容，即使比简单样本更复杂的数据，不管多么复杂的统计模型的观测数据，都要研究这些内容。这些内容是相互关联的，相互确定的。点估计可以视为置信区间的特例。通常认为经典统计、信仰推断和Bayes推断是不同的。换一种观点看经典统计，亦看作分布推断。以下讨论经典推断的分布推断特性。通常将置信上界看做置信度的函数，如果将两者地位互换，就可发现三种推断方式的共性。对任意给定的x，设枢轴量h（x，η）是η的单增函数。η的置信度为γ的置信上界=（x，γ）由下式确定：

由它可导出μ的经典推断。Neyman提出CD概念，作为对1930年Fisher提出的信仰分布（Fiducial Distribution）的解释。尽管CD概念由来已久，近年来作为频率学派的概念重新研究，新瓶装旧酒，作为推断方法加以发展。如前所述，用它代替点估计和区间估计等统计推断。有影响的工作或学者有Efron（1993，1998），Fraser（1991，1996），Lehmann（1993），Schweder和Hjort（2002），认为CD是频率学派的后验分布，是以后统计研究的重点。研究成果清楚表明经典推断也是分布推断。K.Singh，Xie M.G.and W.E.Strawderman（2007）的文章，关于CD做了详尽全面论述，还试图将CD概念推广到多维。在这个意义上讲，经典统计，信仰推断和贝叶斯分析都是用分布函数做推断的。Bayes推断用后验分布，信仰推断用信仰分布（Fiducial Distribution），经典统计用经典推断分布或CD，分布推断是三者的共同点。可以说CD是信仰分布的扩展。设是样本空间，N是参数空间。H（x，·）是定义在×N上，取值于[0，1]上的函数，且满足条件：对给定样本X=x，H（x，·）是N上的分布函数；对给定η∈N，H（X，η）～，其中X～（·，η，λ），则称H（x，·）是一CD。