中国人民银行城市住户抽样方案设计_中国人民银行论文

中国人民银行城镇户调查抽样方案的设计,本文主要内容关键词为:中国人民银行论文,城镇论文,方案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、引言

长期以来,银行储蓄是居民金融资产的重要组成部分,而储蓄与消费又是密切相关的。通过对储户的调查,可以观测和反映消费景气的变动,从中观察和分析总体经济的走势,为货币政策的决策提供依据。

由于以上目的,中国人民银行从1988年第3季度起, 开始进行不定期城镇居民储蓄问卷调查,到1993年形成了按季度调查的制度。共选定20个城市进行调查,其中省会城市12个、中等城市4个、小城市4个。储蓄所的选择由各大城市的人民银行根据储蓄所周围居民阶层的分布情况自行确定。多数城市选择8—9个调查点(储蓄所)。每次共调查10,000名储户,样本量按城市的大小来确定:大城市700人,中等城市600人,小城市400人。

为了完善这项调查制度,使其覆盖面更广、代表性更强,自1995年起,将调查城市扩大到34个,即增加了6个省会城市和7个中等城市。每季度调查一次,每次调查储户20,000人。

近年来,由于我国经济、金融的改革和发展,给货币政策的决策提出了新的要求。中国人民银行需要通过更为规范、更有代表性的、定期的城镇储户抽样调查,随时掌握城镇居民的储蓄状况、储户对物价和消费的判断与预期、以及储户的金融资产与负债状况等,以分析和解释各层次货币供应量及其结构的变动,观察、分析和判断宏观经济的波动,从而为货币政策的决策提供更为客观的科学的参考依据。

显然,沿用多年的调查方法和制度已经不能适应新形势的要求。为此,中国人民银行于1999年初,委托北京广播学院调查统计研究所,为其今后的城镇储户调查重新设计全国抽样方案。

二、抽样设计的思路

本项目采用多级、多层、PPS与等概率相结合的混合抽样方法, 在考虑实际条件和限制的情况下,尽可能地使抽样的科学性和可操作性得到较好的结合,设计切实可行的抽样方案。主要思路有以下几个方面。

1.科学性与可操作性的结合

抽样设计的科学性通常都是统计工作者所追求的最重要的目标,但是如果方案复杂得难于实施,科学性也只能是纸上谈兵。针对本项目的可操作性问题,主要考虑了以下几点:

·由于城镇储户调查已在34个城市实施了三年,因此从设备的配置(每个调查的城市都已配有调查数据的录入联网系统)和连续数据的充分利用上,应使新方案能尽可能多地包含原调查的城市。

·由于调查数据的处理和分析是由中国人民银行统计信息处负责的,并已有自行编制的数据库软件。为此,抽样方案必须按照能够得到近似的简单随机样本的方向去考虑设计。需要加权等复杂计算来估计参数的方案都将给委托方造成极大的困难、甚至无法实施。因此,本方案采用了生成近似自加权样本的设计。

·由于各抽中城市的储蓄所的数量差别很大,少至几十家,多至数千家;而确定储蓄所(抽样点)的这一级抽样所需的“1998年年底储蓄户头数”和“1998年年末储蓄余额”等资料,都是需要一个一个储蓄所去收集的,难度很大。为此,在确定储蓄所的这一级抽样中,将采用二相抽样的方法。即,先从每个城市按某种方式抽取第一相样本100 个储蓄所;以此为近似的抽样框,收集必要的资料,再抽取第二相样本。

2.总体的划分和抽样指标的确定

调查的总体为全国范围所有城市的储户。第一级抽样抽取城市;第二级抽取储蓄所;第三级抽取储户。总体的划分首先是将城市分层(子总体),其次是将抽中城市的储蓄所分层。

所考虑的抽样指标有三种类型:指标的确定主要根据其与所研究问题的相关程度:指标的初选由广播学院调查统计研究所提出,经由中国人民银行的有关专家研究后认定。

·确定分层指标。分层的主要目的是提高精度。分层指标要按照使层内方差尽可能小、层间方差尽可能大的原则来选择。第一级城市分层确定了五个指标:“96年城乡居民储蓄年末余额”、“96年年末市区人口数”、“职工平均工资”、“社会消费品零售额”、“人口密度”;第二级储蓄所分层由于没有更多的基础资料,只选用了一个可操作的指标:“储蓄所所在区域”。

·确定各层抽取单元数的指标(简称单元数指标)。单元数指标的确定关系到是否能够得到一个近似自加权的最终样本。第一级抽样中,先确定每层应抽取的城市数目。拟采用“市区储户总数”这个比较理想的指标,但考虑到为获取该资料所需投入的财力和时间是得不偿失的,因此采用了与该指标高度相关的、容易获取的“市区人口数”为单元数指标。第二级抽样中,先确定每层应抽取的储蓄所数目,理想的指标是“储蓄所储户总数”,由于没有这个资料,采用了相关的“1998年年底储蓄户头数”这个指标。

·确定各层单元抽中概率的指标(简称入样指标)。 入样指标是PPS抽样中确定单元“大小”或“重要性”的指标。第一级抽样中,每层按与“96年城乡居民储蓄年末余额”大小成比例的原则抽取城市;第二级抽样中,每层按与“1998年年末储蓄余额”大小成比例的原则抽取储蓄所。

3.抽样框的准备

三级抽样的抽样框的形成如下:

·第一级抽样的抽样框是比较完整的。按《中国城市统计年鉴1997》的汇总,全国共有666个城市,其中11 个小城市因五个分层指标的数据不完整而不得不略去。

将655个城市的名单及其五个分层指标录入数据库, 形成了一级抽样的抽样框。

·第二级抽样的抽样框是按二相抽样的不同要求准备的。第一相抽样的抽样框是完整的,内容包括抽中城市的全部储蓄所的名单、所属的银行及其所在的区域。第二相抽样的抽样框为100个一相样本的名单、“1998年年底储蓄户头数”和“1998年年末储蓄余额”。

·第三级抽样没有现成的抽样框,不过由于调查的实施将采取在储蓄所现场访问的方式进行,因此暂且将在调查期间(2—3天)前来储蓄所取款或存款的所有储户看成是抽样框的一个近似的缩影。

4.样本量的确定:

本项调查的目标量几乎都以比例的形式出现(共有111个选择项,其中108个是要估计的总体比例:另外3个是平均人口数:家庭人口、劳动人口和就业人口),因此,样本量(按储户数计算)的确定和精度的估算可以按照总体比例π取0.5时的最保守的方法来估算。即, 对于简单随机抽样,当抽样比很小时,若取置信度为95%, 则所需的样本量n[,0]、目标估计量π的最大允许绝对误差△之间有如下的关系:

n[,0]=1.96[2]π(1-π)/△[2]=(0.98/△)[2]

实际的最终样本量为n=20,000 (储户),其中第一级抽取50个城市、第二级抽样每市抽取8个储蓄所(共计400个储蓄所)、第三级抽样每个储蓄所抽取50位储户。样本量的确定综合了如下的考虑:

·根据以往的经验,以及大量国内外大规模抽样调查的实例,取设计效应deff=2,则有实际样本量n=2n[,0]。

·在对全国城镇储户这个总体进行估计时,取置信度95%,最大允许绝对误差不会超过1%,完全可以满足研究的要求:

·在需要对5个子总体分别进行估计时,取置信度95%, 那么最大

允许绝对误差分别不会超过

4.9% —特大城市 n=800

3.0% —大城市, n=2,000

3.5% —人口密集的大中城市, n=1,600

2.0% —经济活跃的中等城市, n=4,800

1.3% —经济欠发达的中小城市,n=10,800

上述误差也基本上可以满足研究的要求。虽然对“特大城市”(只包括北京和上海)这一子总体单独进行估计时,误差比较大(5%)。但是事实上研究者对这一子总体是比较了解的,因为对北京和上海已进行过大量的相关的研究。

·虽然本设计的总样本量n=20,000与中国人民银行以往调查的总样本量是相同的,但是由于采用了分层抽样的方法,同时又增加了第一级和第二级抽样的单元数,因此新方案估计的精度必将显著地提高。

三、具体的抽样程序和结果

具体的抽样程序分成以下几个步骤。

1.第一级抽样:抽取城市

·分层。 根据所确定的5个分层指标:“96 年城乡居民储蓄年末余额”、“96年年末市区人口数”、“职工平均工资”、“社会消费品零售总额”、“人口密度”,分别利用SPSS和SAS软件, 把五个指标的数据标准化,使各个指标的数量级相同,然后进行聚类分析,经反复测试,将655个城市分为五层的结果比较合理。

·确定每层应抽取的一级单元数。 根据所确定的单元数指标“市区人口数”,按比例分配各层应抽取的城市数如表1所示。

表1每层应抽取的城市数

所包含 每层市区

层 特征

城市数 人口数(万人)

一 特大城市21689.42

二 大城市 134599.08

三 人口密集的大中城市 493822.44

四 经济活跃的中等城市156

12772.74

五 经济欠发达的中小城市 435

28066.03

合计 655

50958.71

每层占

应抽取

层 特征

全部的% 城市数

一 特大城市3.3 2

二 大城市 9.0 5

三 人口密集的大中城市 7.5 4

四 经济活跃的中等城市 25.1 12

五 经济欠发达的中小城市

55.1 27

合计 100.50 50

·在各层中抽取城市。 根据所确定的入样指标“96年城乡居民储蓄年末余额”,按照PPS抽样法,使各层内每个单元被抽中的概率, 等于该单元“96年城乡居民储蓄年末余额”与该层“96年城乡居民储蓄年末余额”之比。具体的操作过程为:

·对每层中的全部城市按储蓄余额的大小顺序排列

·对全部城市储蓄余额求和

·确定每个城市的储蓄余额占全部城市储蓄余额总和的比例及累计百分比,使总和为100

·利用EXCEL软件所产生0—1之间的均匀分布的随机数, 根据随机数落在各城市对应累计百分比的范围,确定被抽中的城市

·如果一个城市被抽中两次以上,则以排在前面的城市来代替

·局部调整 由于中国人民银行曾在34个城市进行过三年的调查,为了操作上的便利,对抽中的50个城市进行了部分调整(结果见表2 )。调整的原则为:

表2最终抽中的城市名单

层 第一层第二层

第三层 第四层

城 北京 武汉 邯郸泉州 三亚

上海

重庆 漯河兰州 武进

市西安 南昌新会 金坛

天津 西宁北海 肥城

名广州 柳洲 温州

遵义 瑞安

第五层

城 黄山赤壁 曲阜 侯马

安庆怀化 运城 银川

市 长乐常德 韩城 集宁

广元通化 资阳 满洲里

名 凯里吉安 库尔勒海伦

冀州新民 大理 绥芬河

称 驻马店 营口 延吉

·使50个城市能尽可能多地包括原来的城市(最终包括了23个以前调查过的城市)

·使得每个省都有城市被抽中

·使每层五个分层指标的样本平均值尽可能接近其总体平均值。如表3所示

表3 3各层样本指标与总体指标的比较

层 96年城乡居

编均值 民储蓄年末余年末市区 人口

号 额(万元) 人口数(万) 密度

一总体18151574849 3143

样本18151574849 3143

二总体 4158224353 1592

样本 5035920471 1783

三总体 675642 78 2875

样本 730962 95 2813

四总体 566378 81 744

样本 579913 87 848

一总体 177759 65 424

样本 178913 55 497

层 职工平 社会消费

编 均工资 品零售总 保险保费96年GDP

号 (元)额(万元)

(万元) (万元)

10386

7236447520000

16095300

10386

7236447520000

16095300

二7645

28294801701965774856

7416

34815312649536783258

三6242413030 135241007207

5438412541 94721021495

四7211332537 105091009328

6949421055 11194 978205

一4670113518 2084 351621

4754118843 3206 320459

2.第二级抽样:抽取储蓄所

·第一相抽样 按照分层指标“储蓄所所在区域”,将每个抽中的城市分成四层:商贸区、居民区、机关区、工业区,按照每层内储蓄所数目占总数目的比例,确定每层应抽取的储蓄所数;然后随机地抽取相应数目的储蓄所。每个城市共抽100家储蓄所,反馈给各个城市。 然后收集、上报所需的100家储蓄所的第二相抽样指标资料:“1998 年年底储蓄户头数”和“1998年年末储蓄余额”。

·第二相抽样 按照单元数指标“1998年底储蓄户头数”,先确定每层应抽取的储蓄所个数。然后根据入样指标“1998年末储蓄余额”,按照PPS抽样法,使各层内每个单元被抽中的概率, 等于该单元“1998年末储蓄余额”与该层“1998年末储蓄余额”之比。具体的操作过程与第一级抽样相同(省略)。为了操作上的方便,每个城市抽取了二套方案(每市8个储蓄所),可任选其一。

3.第三级抽样:抽取储户

·计划在每个抽中的储蓄所内,按储户进门的时间顺序, 每间隔m人调查1人,直到调查到了50个为止。m的大小根据调查实施的时间要求及各储蓄所的要求和各储蓄所储户的来所情况决定。

四、结语

在本项研究中,由于关于总体的许多基本数据是未知的、或是需要花很大的人力、物力和财力才能获取的,例如各个子总体的方差等数据;此外,对数据的处理必须是最方便、最简化、能由中国人民银行自行操作的,由于受到这一要求的限制,因此无法采用更为复杂精细的抽样方法。例如按最优分配的原则确定各层的样本量,然后再按加权处理的方式估计总体目标量及其方差的方法等。

本项目所采用的抽样方案,原则是获得一个近似自加权的样本,即,使最终样本近似于等概率样本,使每个城市储户被抽中的机会近似均等,并且在实际操作中可行。虽然这种方案在理论上不一定是精度最高的,但在实际条件下是最为合理的、易于操作的、同时估计精度也是相对较高可以满足研究要求的。样本的代表性较好,例如,由表3可知,各层中七个指标的样本均值与总体均值十分接近,说明50个城市构成的样本对全国655个城市的总体有较好的代表性。

对于实际的精度和实际的抽样设计效应,我们将在完成了调查数据的收集工作以后再作进一步的评估。目前,中国人民银行已经采纳了我们的设计方案,并将在近期进行调查员的培训和调查的实施。

标签:;  ;  ;  ;  ;  ;  

中国人民银行城市住户抽样方案设计_中国人民银行论文
下载Doc文档

猜你喜欢