几何分布的一类贝叶斯停止判决法则,本文主要内容关键词为:判决论文,几何论文,法则论文,贝叶斯论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
引言
以节约样本为目的序贯方法在数理统计中占有重要地位。从实际工作的角度出发,人们往往更强调时间的价值,希望当有足够的证据做出推断时应尽早停止试验,这样就提出了时间序贯计划。近年来,时间序贯方法得到了迅速发展(见[1~6]。[3]和[6]讨论了指数分布的时间序贯检验问题。[5]讨论了单试验平台情形,几何分布的时间序贯检验问题,适合于受试样品比较昂贵的情形。本文讨论多试验平台,受试品比较廉价而试验时间(次数)比较宝贵情形的几何分布的检验问题。
设X[,1],X[,2],…X[,n]~iidP[,θ],P[,θ]是离散型几何分布,即
P[,θ](X[,1]=k)=(1-θ)θ[k-1],k=1,2,…,0<θ<1 (1.1)
而X[,(1)]=…=X[,N[,1]]<X[,(N[,1]+1)]=…=X[,(N[,1]+N[,2])]<…X[,(n)]是相应的次序统计量,我们的问题是检验假设
H[,0]:θ=θ[,0] vs. H[,1]:θ=θ[,1] (0<θ[,0]<θ[,1]<1) (1.2)
由于几何分布通常描述的首次“成功”(概率为1-θ)问题,因而X[,1],X[,2],…,X[,n]可以看作是一组试验样本。{X[,i]=k}表示第i个试验中首次“成功”出现在第k次,或者认为第i个样品的寿命为k。事实上金属软管就是用它能承受的脉冲次数来度量其寿命。原假设H[,0]表示总体平均寿命较短,备择假设H[,1]表示总体平均寿命较长。为行文方便,本文将试验次数与试验时间等同。
对于有n个受试品的试验,其停止法则可以分解为若干步完成。第一步我们称为“n-步”,意为有n个受试品正在试验,其停止时间为t[,n]∧x[,(1)]。如果x[,(1)]>t[,n],则试验在预先指定时间t[,n]处停止;如果x[,(1)]≤t[,n]且N[,1]=j[,1],即在t[,n]之前有j[,1]个受试品同时出现“成功”,这时试验过程进入“(n-j[,1]-步”,其中有n-j[,1]个受试品继续试验。在“(n-j[,1])-步”中,截断时间为t[,n-j[,1]](x[,(1)])(≥x[,(1)]。如果x[,(j[,1]+1)]>t[,n-j[,1]],则试验在t[,n-j[,1]]处停止,如果x[,(j[,1]+1)]≤t[,n-j[,1]]且N[,2]=j[,2],即在预先指定时间t[,n-j[,1]]之前有j[,2]个受试品同时出现“成功”,这时试验过程进入“(n-j[,1]-j[,2]-步”,其中有n-j[,1]-j[,2]个受试品继续试验。如果试验过程在“j[,m]-步”中没有停止,而x[,(n-j[,m]+1)]>t[,j[,m]](x[,(1)],…,x[,(n-j[,m])],则试验过程在预先指定时期t[,j[,m]]处停止。如果x[,(n-j[,m]+1)]≤t[,j[,m]]且N[,m]=j[,m],即最后的j[,m]个受试品在第x[,(n-j[,m]+1)]次试验中将同时出现“成功”,这时试验过程将停止在第x[,(n-j[,m]+1)]次试验完成之后。以后我们称t[,k]为“k-步”中的截断时间。
设π[,1]是θ=θ[,1]的先验概率,π[,0]是θ=θ[,0]的先验概率,π[,0]+π[,1]=1,R=π[,1]/π[,0]是先验概率比。δ表示判决函数:δ=1表示拒绝H[,0],δ=0表示接受H[,0]。误判损失函数为
假定试验费用与试验时间(次数)成正比。τ表示停止时间,则平均风险(包括费用和损失)为
B[,n](π[,1],(τ,δ))=b·E{τ}+E{L(θ,δ)} (1.3)
其中b为正常数,一方面表示单位试验时间(次数)所需费用,另一方面的作用在于统一试验费用和误判损失的量纲。
一、贝叶斯推断
定义1 一个停止判决法则(τ[,0],δ[,0])称为π[,1]-贝叶斯法则,如果
其中x=1,2,…,t,j=1,2,…,n。记
(ⅱ)相应的π[,1]-贝叶斯风险为
根据定理2,我们容易得到贝叶斯停止法则和判决法则。事实上,对于问题(θ[,0],θ[,1],W[,0],W[,1],n),π[,1]=P(θ=θ[,1])是先验概率,R=R[,0]=π[,1]/(1-π[,1])是先验概率比,如果我们知道R[,U,i]和R[,L,i],i=0,1,2,…,n,则我们仅需计算在时间t处的后验概率比R[,t]。假如x[,(1)]>t,即没有受试品在t之前“成功”,则后验概率比为R[,t]=R(t,n,0)=RΔ[nt],随t的增大,其值在t[,n]处达到或超过上界R[,U,n]。“n-步”中的停止时间为τ[,n]=x[,(1)]∧t[,n]。如果x[,(1)]≤t[,n]且N[,1]=j,即在t[,n]之前有j个受试品同时出现“成功”,则后验概率比的向下调整,试验过程进入“(n-j)-步”。此时R(x[,(1)],n,j)相当于前一步中的先验概率比,其作用类似于“n-步”中的R[,0],其取值被新的界R[,L,n-j]和R[,U,n-j]所控制。这个试验过程如此进行,直到结束。
致谢 本文从选题到完成得到北京大学郑忠国教授的无私帮助,在此特表谢忱。