论有关标志等距抽样下的总体推估问题,本文主要内容关键词为:总体论文,标志论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
提要:对有关标志等距抽样下的总体推估问题,我国统计学界尚未获得一致的解决办法。本文在评析李金昌和雷钦礼二同志提出的两种方法的基础上,结合国外现代抽样技术又提出了回归估计法、比率估计法、耶茨两端校正估计法、PPS——等距抽样法估计四种新方法,这些方法分别适用于不同情况。
通过优化总体单位排序,有关标志等距抽样能使样本单位均匀地分布在总体,且具有经济、快速、简便的优点,因而它在我国的抽样调查中得到了广泛的应用,甚至被个别学者误认为是一种在我国发展起来的独特抽样方法[①]。但是,如何对其进行总体推估并估算相应的抽样误差,我国统计学界仍未获得一致的解决办法。近两年来,杭州商学院李金昌同志和山西财经学院雷钦礼同志先后分别在《统计研究》上各自提出了两种估计方法,即近似线性直线趋势回归估计法、排队标志相关跟踪估计法和比率估计法、回归估计法[②]。这些方法的提出无疑会促进我国统计学界对这一问题的探讨。本文旨在对这些方法进行评析,然后提出四种总体推估方法。为论述方便,文中一律以大写字母表示总体的标志,以小写字母表示样本标志,其中X、Y分别为总体的有关标志和研究标志,B为总体回归系数,r为随机起点数,K为抽样距离,V为方差,其余字符及所表示的统计意义均同常用的统计符号。
一、李、雷所提估计方法评析
(一)近似线性直线趋势回归估计法
它源出于用假设的总体回归方程Y[,i]=a+bi(i=1~N)来例证和比较线性趋势下不同抽样方式的抽样方法[③],所以,它讨论的是极端简化的情况,既不能用来进行实际总体的推估,也不能用来估算实际的抽样误差。因为决定研究标志具体数值的是有关标志值的大小而不是其排列的位次,有关标志值的排列次序与研究标志值之间并不存在任何经济意义上的联系,我们不能把它作为回归模型中的自变量来对待。
(二)排队标志相关跟踪估计法[④]
可见,这种估计方法在回归直线过原点的情形下是适用的,否则会对总体均值少估一个截距项。从上也可看出,这种估计方法实际上就是截距项为零时的回归估计,所以它并不是什么新的估计方法。同时根据抽样理论,结合有关标志等距抽样下两个标志之间的密切相关性可知,这种估计方法的抽样误差一定小于简单随机抽样误差公式计算的抽样误差,并且两标志相关越密切,其相对有效性就越明显,这其实也是不需例证的,这也说明雷钦礼同志那种认为李金昌同志用来证明其估计量准确可靠的例子纯粹是一种巧合的观点也是不对的。作为一种回归估计方法,它自然就具有回归估计的优点。
(三)比率估计法和回归估计法
这两种估计方法为雷钦礼同志提倡,并被认为是优良适用的估计方法,而且他把这两种估计方法和简单平均数估计方法这三者的抽样方差进行了比较论证。但是,他的论证等都是对所有可能抽取的K样本而言的,他并没有给出实际可用的抽样方差计算,而且有关抽样方差的比较也没有结合有关标志等距抽样的特点进行,因而所得到的结论也同统计书籍中关于这三种估计方法抽样方差的比较结论一样,同是一般性的、原则性结论。对此,笔者认为,有关标志等距抽样的特点在于有关标志与研究标志是密切相关的,因此,从抽样效率来看,回归估计和比率估计都优于现行的简单平均数估计,回归估计又优于比率估计。但是回归估计计算较麻烦,在多阶段抽样中更是如此,而比率估计的计算则相对简单些,所以,如果选取的有关标志能反映总体单位的大小,使回归直线大致过原点(如农产量对播种面积的回归直线),那么以采用比率估计为好,否则以采用回归估计为优。当然还有其它方法(见下一部分)。但是,不论采用何种估计方法,我们的目的都是为了解决有关标志等距抽样中实际存在的有关总体推估问题,因此,不能只能对所有可能的K套样本作文章(实际中不可能抽取所有可能的样本),而应该给出实际中可用的有关总体估算式,包括总体均值及其抽样方差的估算式。
二、四种总体推估方法
根据以上评析,结合国外现代抽样技术,笔者认为,在有关标志等距抽样下可以采用下列四种总体推估方法:
1.回归估计法,即根据总体回归直线Y=a+bx,用下列式子来估计总体均值及其抽样方差:
这四种估计方法所得到的估计量在作为优良估计的标准上各有千秋,其中第二种和第四种方法适用于回归直线过原点的情况,而第一种和第三种方法则不一定要求回归直线过原点。所以,究竟选用哪一种估计方法好,要视具体情况和对估计量的要求而定。最后需要强调的是,在有关标志等距抽样中,据以排队的有关标志一定要选得与研究标志最为密切,只有这样才能充分发挥这种抽样方式的优点。
标签:等距抽样论文; 样本均值的抽样分布论文; 多阶段抽样论文; 抽样分布论文;