广州尼尔森市场研究有限公司北京市场调查分公司 北京市东城区 100010
摘要:许多统计学教材关于假设检验中拒绝域和接受域的确定过程过于简洁而导致相关知识抽象、难懂,故对这个过程的深入研究很有必要。首先展示了假设检验的基本思想,接着给出了关于一个总体参数的单侧检验、双侧检验过程中拒绝域和接受域确定的推理、推导过程,并展示了应用实例。最后,对当前统计学教材中假设检验内容的组织提出了一点建议。
关键词:假设检验;拒绝域;接受域;推理
1前言
同数理统计教材相比,一般统计学教材中假设检验的方法和步骤常常显得十分简洁、直观,但这样做的缺点也很明显:一些数学推理过程被屏蔽起来,解题过程十分抽象、步骤间跨度较大,推理不清晰。这样的教材对非统计学专业和非数学专业的教师、学生而言无疑大大加重了他们讲解、学习这门课程的难度,使他们感到假设检验的过程十分抽象,令人困惑。区间估计和假设检验是统计推断中的重要内容,是两个不同的统计概念,但它们又有着密切的联系,在某种意义下是同一问题的两个方面。这两种统计推断方法都是通过对具体问题的随机抽样所得到的样本观察值,用数理统计学的方法进行统计分析并做出判断。深刻理解参数假设检验中的若干基本问题,了解统计推断中参数的假设检验与区间估计之间的关系、不同类型的假设检验适用范围及应注意的问题,对正确的掌握和应用统计推断方法是极为重要的。因此在教学过程中,把这些被许多统计学教材没有涉及到的推理内容搞清楚是十分必要的。
2假设检验的定义与基本原理
在假设检验中,常把一个被检验的假设称为原假设或者零假设,用H0表示。通常将不应轻易加以否定的假设作为原假设,当H0被拒绝时而接受的假设称为备择假设,用H1表示,它们常常成对出现。由样本(x1,x2,?,xn)对假设进行推断总是通过一个恰当的统计量T(x1,x2,?,xn)完成的,该统计量T(x1,x2,?,xn)称为检验统计量。使原假设被拒绝的样本观测值所在区域称为拒绝域,一般它是样本空间Ω的子集,并用W表示,Wˉ称为接受域;统计量T(x1,x2,?,xn)的拒绝域记为T(W)。假设检验的基本原理是小概率事件原理,即:概率很小的事件在一次试验中实际上是不可能发生的;基本方法是“反证法”,若小概率事件发生则拒绝原假设H0从而接受备择假设H1,否则接受原假设H0。
3双侧检验拒绝域的确定
在双侧检验问题中,一般统计学教材中的解题步骤简洁、清晰,但推理过程含混、抽象,甚至一些推理略而不提。不妨以一个总体的总体均值和正态总体方差的假设检验为例。
3.1总体均值的双侧假设检验
例1:某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为μ0=0.081mm。今换一种新机床进行加工,抽取N=200个零件进行检验,得到的椭圆度均值为0.076mm,样本标准差为s=0.025mm。问新机床加工零件的椭圆度的均值与以前有无显著差异?(α=0.05)。许多统计学教材中对此题的求解过程如下:解:H0:μ=0.081,认为新旧机床加工零件的椭圆度的均值没有显著差异;H1:μ≠0.081,认为新旧机床加工零件的椭圆度的均值有显著差异;由题意可知这是一个双侧检验问题,拒绝域应该在抽样分布曲线的左、右尾部,如图1所示。由题意可知,μ0=0.081mm,s=0.025mm,X=0.076mm,N=200。由于大样本,故可以用z统计量。
3.2正态总体方差的双侧假设检验
设总体X~N(μ,σ2),其中μ、σ2均未知,X1,X2,…,XN为来自总体X的样本(样本容量为N),由样本可以计算出样本方差为s2。(已知显著性水平为α)如果遇到如下的双侧检验问题:H0:σ2=σ20H1:σ2≠σ20,其中σ0为已知常数。
4假设检验的两类错误
对于给出的拒绝域W,由于抽样的随机性,我们做出的判断不可能绝对正确,它可能会犯两类错误。第一类错误:当H0为真时,但(x1,x2,?,xn,从而拒绝H0。这种错误称为第一类错误,又称为“弃真错误”,其发生的概率通常记为α,即α=P{}拒绝H0|H0为真=P{T(x}1,x2,?,xn)∈T(W)|H0为真=Pθ{(x1,x1,?,xn)∈W},θ∈Θ0就是假设检验的显著性水平。
第二类错误:在H0不真时,但(x1,x2,?,xn)∈Wˉ,从而接受H0。
期刊文章分类查询,尽在期刊图书馆这种错误称为第二类错误,又称为“纳伪错误”或你“取伪错误”,其发生的概率通常记为β,即β=P{?}接受H0|H0不真=P{?T(x}1,x2,?,xn)∈T(Wˉ)|H0不真=Pθ{(x1,x2,?,xn)∈Wˉ}=1-Pθ{(x1,x2,?,xn)∈W},θ∈Θ1定义1设检验问题H0:θ∈Θ0vsH1:θ∈Θ1的拒绝域为W,则样本观测值(x1,x2,?,xn)落入拒绝域W内的概率称为该检验的势函数,即g(θ)=Pθ{(x1,x2,?,xn)∈W},θ∈Θ=Θ0?Θ1其中,Θ0,Θ1是参数空间两个互不相交的子集。由两类错误的概率α、β与势函数的意义,可知它们之间的关系为:
为说明α与β之间的关系,假设(x1,x2,?,xn)是来自正态总体N(θ?,?σ2)的样本,其中σ>0已知,设检验H0:θ∈Θ0???vs??H1:θ∈Θ1的拒绝域为W={xˉ:xˉ≤c}。
由此可以看出,当α减小时,c也减小,而c的减小必导致β的增大;当β减小时,c会增大,而c的增大必导致α的增大。故得到两类错误的关系:
(1)在样本容量n一定时,α与β不能同时减小,α的减小必导致β的增大;β的减小必导致α的增大。
(2)要使α与β同时减小,则只有加大样本容量n,但又增加了检验的成本这在有些情况下又是不现实的。一般情况下控制α,使β尽量小。定义2对检验问题H0:θ∈Θ0vsH1:θ∈Θ1,如果一个检验满足对任意的θ∈Θ0,都有g(θ)≤α则称该检验是显著性水平为α的显著性检验,简称水平为α的检验。可见,显著性水平α就是用来控制犯第一类错误的概率的。最常见的选择是α=0.05,有时也选择α=0.1或α=0.01。
5检验的p-值
假设检验的结论通常是简单的,在给定的显著水平α下,不是拒绝原假设就是接受原假设。然而有时也会出现这样的情况:在一个较大的显著水平下得到拒绝原假设的结论,而在一个较小的显著水平下却得到相反的结论。检验的p-值是一个非常重要的概念,许多统计应用软件(如Excel、SPSS、EViews等)检验的输出结果都有检验的p-值(p-value),可以根据p-值和任意给定的显著性水平α直接作出接受或拒绝原假设H0的结论。
定义3在一个假设检验问题中,利用样本观测值能够做出拒绝原假设的最小显著性水平称为检验的p值。引进检验的p值的概念有明显的好处:首先,它比较客观,避免了事先确定显著水平;其次,由检验的p值与人们心目中显著性水平α进行比较可以很容易做出检验的结论:(1)如果α≥p,则在显著性水平α下拒绝H0;(2)如果α<p,则在显著性水平α下应保留H0。设T为检验统计量,T0为由检验统计量得到的观察值,针对原假设和备择假设由T0为临界值确定的拒绝域为W0,检验的p值为:p=P{T∈T(W0)}=P{(x1,x2,?,xn)∈W0}对于正态总体参数的u检验和t检验等对称的情形有:
若假设为:H0:θ≤θ0vsH1:θ>θ1,则p=P{T≥T0};
若假设为:H0:θ≥θ0vsH1:θ<θ1,则p=P{T≤T0};
若假设为:H0:θ=θ0vsH1:θ≠θ1,则p=2P{T≥T0}。
其他检验的p值可以类似推出。
6单侧检验的设定与拒绝域的确定
对于参数的单侧检验比较难于掌握的是原假设的设定和拒绝域的确定。单侧检验原假设H0的设定应遵从以下原则:
H0不能轻易被否定;(2)等号包含在原假设H0内;(3)根据问题的背景来设定原假设。由于原假设H0中参数的设定不是一个常数,而是一个范围。在H0成立的条件下,检验统计量在拒绝域内取值的概率只能通过不等式来确定,由此可以得到拒绝域是概率不超过α的更小概率得事件。下面以单正态总体均值μ的单边检验为例来说明。设(x1,x2,?,xn)是来自正态总体N(μ?,?σ2)的样本,分别为样本均值与样本方差。
结束语:
假设检验是推断统计的重要内容之一,对它进行深入的理解和掌握是十分重要的。但由于现行的许多统计学教材变重应用而轻推理的思想的影响,导致假设检验求解过程被简化、淡化。殊不知这从另一方面反而加重了教师、学生学习统计学的难度,在某些院校一定程度上造成了这门课程教师不愿教或教不透,学生不愿学或学不懂的局面,建议在统计学教材中应该适当补充一些基本的推理、推导过程,这样才能使这门课程显得比较通俗易懂。
参考文献:
[1]罗荣华,吴锟.假设检验的一种新思维[J].统计与决策,2014(08):23-25.
[2]辛嵩,孟祥喜,卜凡秀,刘建康.假设检验在矿井风速检测中的应用[J].煤炭技术,2015,34(06):177-178.
[3]徐岩,刘岩,高劲松.统计假设检验在水利工程质量监督中的应用[J].水利建设与管理,2003,23(06):49-51.
[4]谢民育,李照海.假设检验的优良设计及其在基因连锁分析中的应用[J].中国科学(A辑:数学),2003(04):397-408.
[5]徐圣兵,龚力强.复生长曲线模型中参数的无偏似然比检验准则[J].广州大学学报(自然科学版),2011,10(05):7-12.
[6]史文雷.经管类专业《统计学》教学中应融入数学模型思想[J].职业时空,2012,8(04):66-67.
论文作者:莫锦恳
论文发表刊物:《防护工程》2019年第4期
论文发表时间:2019/5/31
标签:样本论文; 统计学论文; 概率论文; 水平论文; 错误论文; 总体论文; 教材论文; 《防护工程》2019年第4期论文;