异常数据测试的屏蔽效应_屏蔽效应论文

异常数据检验的屏蔽效应,本文主要内容关键词为:屏蔽论文,效应论文,异常论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:O213 文献标识码:A

一、定义

x[,1],x[,2],…,x[,n]是n个独立的观察值,检验x[,1],x[,2],…,x[,n]是否来自同一分布F,相当于作如下的假设检验:

H[,0]:设x[,1],x[,2],…,x[i.i.d.][,n]~F(x);

H[,k]:x[,(1)],…,x[,(n-k)]是来自F(x)的次序统计量,x[,(n-k+1)],…,x[,(n)]是来自G[,λ](x)的次序统计量。其中F与G属于同一分布族,只不过改变了某一个参数,其变化反映在λ上,λ称为异常参数,衡量偏差程度。

设T(x)是剔除一个异常观察值的检验统计量,设拒绝域为A[,n,a],由于缺乏关于样本异常数据个数的信息,真实情况可能不是只有一个异常观察值,即不一定是H[,1]成立。例如:一个正态样本为3,4,7,8,10,949,951,检验为D[,1]=(x[,(n)]-x[,(n-1)])/(x[,(n)]-x[,(1)])=2/948<d[,a](d[,a]为a 水平的临界值),不可能剔除掉x[,(n)],这是由于x[,(n-1)]“屏蔽”了x[,(n)],这种现象被Murphy(1951)[2]称为屏蔽效应。在这种情况下,检验统计量T(x)就可能不能检验出一个异常数据,或者说剔除掉一个异常数据的效率下降了。

为了衡量屏蔽效应,Bendre and Kale(1985)[3]提出了一种衡量的定义。

P[,1](λ)设=P{T(x)∈A[,n,a]│H[,1]},(1)

P[,2](λ)=P{T(x)∈A[,n,a]│H[,2]},k≥2 (2)

显然,P[,1](λ)是检验的势函数,P[,2](λ)是假设有多个异常数据时检验的势函数,这样,就可以定义屏蔽效应的测度为:

M[,λ]=P[,1](λ)-P[,2](λ) (3)

由于这两个分布含有两个参数,则异常数据的产生有可能是位置参数的变化,也有可能是刻度参数的变化,更复杂的情况是两个参数都有变化。本文仅讨论位置参数μ有异常的情况(只需讨论极值分布)。

由于所有讨论的检验都是基于μ和σ的不变估计, 则不妨设μ=0,σ=1,

由于只讨论x[,(n)]是否异常大,关于x[,(1)]是否异常小可以类似地讨论,所以不妨设λ>

标签:;  ;  

异常数据测试的屏蔽效应_屏蔽效应论文
下载Doc文档

猜你喜欢