永久随机数在多层次调查中的应用,本文主要内容关键词为:随机数论文,多层次论文,调查中论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:F224.0文献标识码:A
永久随机数法抽样技术可以有效地控制相似或重叠调查总体的样本重叠率。在这一抽样技术中,抽样框的每个单元都被赋予从区间[0,1]产生的随机数,并保留下来,不再改变。随机数具有某一特征的单元将入样。因为随机数被保存下来,因此称之为永久随机数(PRNs),记作。永久随机数法抽样技术强调随机数与调查单元的唯一确定性。如果有新的调查单元产生,则随之产生与之相对应的新的随机数,并参与到总体中;如果有旧的单元消亡则将随机数与单元一起从总体中删除,因而能够实现抽样框的维护。这一过程可以看成总体单元以其所赋予的随机数为标志,均匀分布在[0,1]之间,抽取随机数即为抽取调查单元,于是可以实现抽样的随机性。之所以选择区间[0,1]是因为该区间可以构成循环的系统,在抽样过程中,如果选择的抽样区间的终点大于1,则将抽样区间的终点减去1,新的随机数又落入[0,1]区间,于是可以方便地实现样本轮换。
永久随机数法抽样技术能很好地解决同步调查的样本兼容问题[1]。将永久随机数法抽样技术应用在多层次调查中,可以方便地实现样本追加,并使抽到的样本对本级总体有很好地代表性。由于永久随机数法抽样技术实施起来非常方便,而且又能方便地实现与规模成比例不等概率抽样、多目标调查,并能有效地实现样本轮换,同时可以找到与其相适应的目标估计量的方法和估计精度的计算方法,因而永久随机数法抽样技术不失为一种解决多层次调查问题的有效方法。
在多层次调查中采用永久随机数法抽样技术实现多层次调查的样本兼容,首先要强调调查单元与永久随机数的唯一确定性。虽然在抽样过程中可能需要调整永久随机数(如永久随机数的修匀、为了实现序贯抽样而实现抽样起点归零等等),但是在调整的过程中抽样框中的每个调查单元的永久随机数都参与相同的调整过程,此时新的随机数与原始随机数一一对应,也就是说新的随机数与调查单元也是唯一确定的。一定要避免在总的抽样框中调查单元有一个随机数,而在子总体(或者层)中调查单元又出现一个永久随机数,这样就会破坏调查单元与永久随机数的唯一确定性,不能有效地实现多层次调查中的样本的兼容。
一、应用序贯简单随机抽样实现多层次调查
序贯srswor是指抽取抽样框中永久随机数最小的n个单元构成样本[2]。在我国的多层次调查中,如果上下两级调查都采用序贯srswor的方法抽取样本,只要上一级调查分配在下一级调查中的样本量,小于下一级调查为了满足本级管理需要而确定的样本量,那么上一级样本单元将完全落入到下一级样本中。笔者以省级样本为上一级样本,以市级样本为下一级样本进行说明。
在多层次调查中,省级采用序贯srswor抽样方法抽取样本,即抽取全省的调查单元中永久随机数最小的n个单元构成样本。全省的调查单元可以根据行政区划分成市,省是市的和,那么省级样本单元分布到市级,仍然是最小的单元。为了满足本级管理的需要,市级也抽取永久随机数最小的单元作为本市的样本。通常情况下,市级样本单元的数量应该多于省级样本落入本市的单元的数量。而同一调查单元只有唯一的永久随机数,此时市级样本必然包括省级样本单元。也就是说,仅有一种可能市级的样本不完全包含省级样本单元,即省级样本单元分配到某市的单元的数量大于该市为满足本市调查的需要而确定的样本量,这种情况显然很少发生。
现在以一个简单的例子说明在采用序贯srswor时多层次调查样本兼容的实现。假定某省共有三个市:A、B、C,A共有14个调查单元,B共有20个调查单元,C共有16个调查单元。给所有的调查单元赋予永久随机数,并将永久随机数按大小排队,如表1(表略,见原文)所示。省级抽取永久随机数最小的10个单元构成省级样本,即抽取表1中“所有单元”第一行的单元构成样本,如阴影所示。该样本落入市级分别是A市的前2个单元;B市的前5个单元;C市前3个单元。如果各市抽取30%的单元构成样本,则A市应抽取前5个单元;B市应抽取前6个单元;C市应抽取前5个单元,如斜体所示。由表1不难看出省级样本单元全部落入市级样本。市级在进行为本级管理需要的抽样调查时,只要在省级样本的基础上相应增加调查单元即可。于是达到了很大程度上的样本兼容,从而能够提高样本的使用效率,节约调查成本,提高工作效率。
需要说明的是,永久随机数在[0,1]均匀分布,同时具有随机性的特征。因此在给抽样框的调查单元赋予永久随机数时,不能绝对避免永久随机数扎堆的情形,也就是说可能会出现在某一市调查单元的永久随机数恰好都非常小的情形。于是省级样本落入该市的单元可能会多于该市为了满足本级调查所需的样本量,于是会出现省级样本单元落在市级样本之外的情形。即使是这种情形发生,省级样本和市级样本也是完全兼容的,只是市级样本完全包含在省级样本中。那么在抽样调查时,市级只需要根据本级调查的要求抽取样本进行估计,而需要在本级样本的基础上继续抽取样本上报省级,以满足省级调查的需要。例如,在本文给出的例子中,如果市级采用与省级相同的抽样比率,则抽样框中的第五个单元作为省级样本却落在市级样本之外,即上述省级样本分配到市级的单元数量多于市级为了满足本级管理需要所抽的样本量。这种情况完全是永久随机数的随机性引起的。由此可以得到启示,为了实现样本的兼容,只要能让市级抽样比远远大于省级抽样比,那么省级样本的单元将会完全包含在市级样本中。这一点在工作中很容易实现,否则会导致省级的工作量庞大,省级的调查工作失去了意义。
在序贯srswor中,抽样的起点可以在抽样框中的任何位置。同理在多层次调查中,只要各级调查都采用相同的抽样起点和相同的抽样方向,就能够实现样本的兼容。假定将序贯srswor抽样的起点平移至a。假定将所有调查单元的永久随机数进行调整,令。在调整了永久随机数的抽样框中,各层次调查都按照序贯srswor抽样的方法抽取样本,则样本兼容的原理与使用原始的永久随机数的样本兼容一致。假定a=0.1,则各层次调查都抽去永久随机数从右侧最接近0.1的单元构成样本,则各层次调查能够有效的实现样本兼容。正是在序贯srswor中各层次调查平移抽样起点,仍然能够实现各层次样本兼容的性质,保证了在多层次调查中,即使进行样本轮换,也能很好地实现各层次调查的样本兼容。
二、应用Poisson抽样实现多层次调查
由于Bernoulli抽样是Poisson抽样的等概率特例[3],因此在讨论了Poisson抽样在多层次调查中的实现后,再讨论Bernoulli抽样在多层次调查中样本兼容的实现。笔者仍然从抽样起点a=0开始讨论。
全省根据行政区划分为市,要想使各市内抽样的结果与省级抽样结果一致,在永久随机数保持不变的情况下,只能是单元在各层内的入样概率与在省级的相同。
附图
笔者仍然采用上述序贯srswor中的数据来说明Poisson抽样实现样本兼容的方法。假定省级仍抽取10个单元构成省级样本,A市为了满足本级管理需要抽取5个单元构成本市样本;B市抽取10个单元,C市抽取6个单元。分别计算单元在假定的省级的入样概率和在各市中的入样概率(如表2(表略,参见原文)所示)。在省级和市级分别按照Poisson抽样的原则抽取样本。与上例相同,永久随机数带有阴影的单元为省级样本单元,永久随机数是斜体的单元为市级单元。由表2不难看,省级样本单元全部落入市级样本。
通过以上推导可以得到结论,在多层次调查中采用抽样起点a=0的Poisson抽样,只要下一级为满足本级管理的需要所抽的样本量大于上一级样本分配在本级的样本量,上一级样本单元会全部落入下一级样本中。需要注意的是,由于Poisson抽样的样本随机性的原因,最终实现的样本量与期望样本量有一定的差异,这一点在多层次调查中仍然有可能出现,这可以通过永久随机数的修匀来减少随机样本量的变动情况。另外,由于永久随机数的随机性,可能会出现最终实现的上一级样本分配到下一级的样本量比下一级调查的期望样本量还要大的情况。但是只要在各级调查中都采用Poisson抽样,而且下一级的调查的期望样本量,大于上一级调查根据规模的比重分配到本级的样本量,那么上一级的调查单元就会完全包含在下一级调查的样本中。
于是省级的调查单元必然同时是市级的调查单元,即上一级调查的样本单元完全落在下一级的调查样本中。在调查中,只要再下一级调查中使用Poisson抽样,就可以抽到满足本级和上一级调查的样本。
三、永久随机数法抽样技术实现多层次调查方法述评
永久随机数法抽样技术有很多优良的性质,能很好地实现多层次调查的样本兼容就是其中之一。永久随机数法抽样技术强调随机数与调查单元的唯一确定性,即在省、市、县,调查单元只有唯一的永久随机数。即使是因为抽样调查的需要而调整永久随机数,新的随机数与原始随机数必须是一一对应的,也就是说新的随机数与调查单元也是一一对应的,一定不能在各级调查中同一调查单元出现不同随机数,这样就会影响了调查的统一性,很难控制多层次调查的样本兼容。
永久随机数法抽样技术实现多层次调查的特点主要表现在以下4个方面。
1.永久随机数法抽样技术的多种抽样方法都可以实现多层次调查的样本兼容。永久随机数法抽样技术并不是只有以上几种抽样方法能实现多层次调查的样本兼容,其他抽样方法如PoMix抽样、MPPS抽样、Pareto抽样、配置抽样等都可以实现多层次调查的样本兼容。笔者将永久随机数法抽样技术按样本量是否确定分为两类,即随机样本量的抽样方法和固定样本量的抽样方法,随机样本量的抽样方法在多层次调查中样本兼容的实现可以参照Poisson抽样的方法实现,而固定样本量的抽样方法可以参照序贯Poisson抽样的方法实现。
2.科学性强,有完善的理论背景。应用永久随机数法抽样技术实现多层次调查是以永久随机数法抽样技术的同步调查理论为背景的。笔者在国外相关理论的支持下,永久随机数法抽样技术的同步调查理论进行了相对完备的研究,为多层次调查提供了相对完善的理论支持。
3.采用自上而下的设计思路。在调查过程中,只有分配到上一级调查的样本单元的下一级单位才必须进行调查,而没有分到上一级调查单元的单位可以根据自己的需要确定是否进行调查。这样一来,免去了上级调查的工作受所有下级单位的工作的效率影响的弊病,同时减轻了下级单位的工作负担,能有效地提高工作效率。
4.操作简便,上下级调查统一。应用永久随机数法抽样技术实现多层次调查时,各级调查采用相同的抽样方法,如都采用Poisson抽样或者Bernoulli抽样等,就可以实现样本的兼容。样本追加自然而然就完成了,操作非常简单。各级政府为了满足对信息的需求,确定不同的样本量。只要下级的样本量多于上级分配在本级的样本量,上级样本分配在下级的单元就会全部落入下级样本。于是实现了样本兼容,可以很大程度提高样本的利用效率,节约调查成本,合理分摊调查费用,满足分级管理的需要。