社会调查中不同收入测量方法的特点及其应用,本文主要内容关键词为:及其应用论文,收入论文,测量方法论文,社会论文,调查中论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、研究的问题及其意义
收入既是衡量人们社会经济地位的重要指标,也是社会研究中最为重要的分析变量之一。在著名社会学家布劳、邓肯关于美国职业结构的经典研究中,收入就是他们所构建的“社会经济地位指数”(SEI)中两个基本的变量之一。在社会分层研究、职业声望研究、社会流动研究等众多领域中,收入都是最重要的基本变量。而“在由政府资助的调查所收集的统计资料中,也许没有什么比收入更为普遍存在,或者比收入更为普遍地与大量重要的政策问题相关”[1]。从更广泛的意义上看,收入是研究各种社会现象及社会问题的社会调查中必问的个人背景资料之一。
然而,我们该如何测量人们的收入呢?从理论上说,对人们收入的最为精确、最为客观的测量是进行收入登记或记账。然而,对于绝大多数社会研究者来说,这种方法在现实中常常是做不到的。就是对于国家统计部门长期以来一直使用的住户记账方法,也有统计工作者根据基层调查的反复实践认为其“应该完成历史使命了”[2]。那么,在实际社会调查中,研究者是如何测量人们收入的呢?从目前情况看,社会调查中比较常见的收入测量方式有两种:一种可以称为自报法(或自填法、填空法),即由被调查者根据自己的实际收入情况向调查员报告具体的收入数字,或者由被调查者自己在问卷中询问收入问题后面的横线上直接填写收入的具体数字;二是区间法(或区间选择法),即研究者事先准备好一组划分不同收入的区间或范围,被调查者根据自己的实际情况选择代表其收入的那个区间作为回答。
在实际调查中,不同的研究者往往采用不同的方法:有的习惯采用填空法,有的则偏爱区间法;就是在同样采用区间法的研究者中,各人所设置的区间范围、区间数量、区间大小等等又互不一样。值得注意的是,众多研究者虽然在社会调查中一直采用各种具体的测量方法,但是对于“不同的收入测量方法在实际运用中各自具有什么样的特点?特别是具有哪些缺点和不足”,“对于同一组对象,当我们采用不同的收入测量方法时,所得到的结果是否会有显著的不同”,“在实际应用中,不同的方法(或者不同的设置)会出现什么样的问题”,“如果不注意这些问题将会给调查带来什么样的偏差和后果”,“要克服这些偏差,在实际应用时应注意什么”等等问题,却很少有人去认真思考和进行探讨。
潜在的问题是,如果以不同的方式进行调查时会得出有显著差别的结果,或者不同的测量方式所具有的弱点和不足会对测量结果产生极大的影响,那么,一旦研究者在社会研究中采用了不恰当的测量方式而得到不合理的收入数据时,就不仅会在描述性研究中给人们认识和了解社会现象带来一定的偏差,同时也会在解释性研究中由于加入了收入变量而使得统计分析的模型变形,最终导致对变量之间的各种关系及社会现象规律的解释和说明遭到曲解。因此,无论是对于描述性研究来说,还是对于解释性研究来说,研究者都应该重视社会调查中对收入这一变量进行测量的方法。
英文文献中,美国人口普查局的专家曾对调查中收入测量的质量进行过专门的研究,但他们将主要的注意力集中在调查中的无回答现象及其对收入测量质量的影响上[3]。Jeffrey C.Moore等人探讨了收入调查中由回答者认知因素所导致的回答误差的数量和性质,以及导致回答者产生这些误差的认知基础问题。他们认为,“无回答的比例是衡量收入测量质量的两个典型指标之一”[4]。德国学者Jrg Peter Sehrpler也利用德国社会经济追踪调查(SOEP)的资料,对收入调查中的无回答现象进行了分析,研究得出结论,认为对于收入调查的质量来说,十分重要的一点是要将“拒绝回答”与“不知道”两种情况加以区分。[5]
国内文献中,一些统计学者探讨了如何利用概率统计方法来估计或避免敏感性问题、特别是收入问题调查中所存在的偏差[6],但从实践角度看,这些探讨对于社会调查中收入测量的实际运用来说,存在着可行性相对较差的缺陷。另外,这些研究对社会调查中测量收入所使用的具体形式的特点和不足等问题则没有涉及。文献回顾表明,目前尚未有人依据经验调查的数据来对社会调查中不同收入测量方法的效果及特点进行专门探讨。
尽管收入调查会涉及到被调查者认知因素、心理因素以及无回答比例的影响,但本研究不打算讨论这些方面的问题,而只将讨论的焦点集中在不同的测量工具对回答结果的影响上。换句话说,本研究的目标是通过收集和分析采用不同收入测量方法所得到的实际数据,来比较不同的收入测量方法各自的特点,探讨对于相同的对象采用不同的测量形式所得结果的异同,并对实际调查中应该如何正确运用收入的测量方式提出操作性建议。
二、研究设计
本研究的基本逻辑与实验设计相似,即选择几组完全相同的对象,分别采取几种不同的测量方法进行调查,然后比较和分析不同测量方法所得到的结果。这里之所以选择多于两组调查对象,是因为除了要比较填空法与区间法两种方法的效果外,笔者还希望进一步对区间法中不同区间设置的效果进行比较。
本研究所用数据来自笔者2004年在全国12个城市对1786名在职青年进行的一项调查。该调查采用多段随机抽样的方法,在每个样本城市选取相同的15种职业,从中抽取150名年龄在18-28岁的青年职工。该调查共发出问卷1860份,收回有效问卷1786份,有效回收率为96%。总的样本的设计和抽取方式详见笔者相关论文的介绍。[7]
要进行这种比较的前提条件之一,就是要保证用于比较的几组对象是相同的,即各组对象本身在各种特征上不存在先天不一致的情况。这是我们的第一个任务。
(一)建构四组完全相同的对象
为了获得四个基本相同的子样本,笔者在调查设计中采用了随机化分发问卷的方法。笔者事先将调查问卷设计成四个不同的版本(问卷中的问题完全一样,但部分问题的答案形式或填答形式不同),每一种版本印制的数量相同(各占1/4)。在将问卷邮寄到各个调查城市之前,将每个城市的160份问卷均按1、2、3、4四种版本一份一份地交叉排列。各地调查者并不知道该问卷有四种版本。所以,问卷的发放完全处于一种随机化的状态中。最后汇总统计的结果也表明,收回的1786份有效问卷中,四种版本的问卷数量分别为448、445、447、446份,分布非常均匀。
由于我们采取了随机化的方法来分组,因此,虽然我们事先并不能清楚地知道这四个组的对象在各种特征上的具体分布状况,但可以推测这种分布应该是基本相同的。对实际调查数据进行样本分析的结果完全证实了我们的推测。下面是对样本中四组对象在性别、年龄、文化程度、婚姻状况、是否独生子女等个人基本背景特征上的百分比分布和差异显著性的检验结果,见表1。
表1 四组对象的个人背景分布及检验(%)
甲组 乙组 丙组 丁组
显著性检验
性别 男
45.5 50.1 47.2 44.6 P=.370
女
54.5 49.9 52.8 55.4
年龄 18-21岁 12.0 10.9 11.1 11.3
22-25岁 46.3 47.8 42.5 45.1 P=.763
26-28岁 41.8 41.3 46.4 43.5
(均值)
(24.6岁)
(24.7岁)
(24.8岁)
(24.7岁)(P=.688)
文化程度 初中 6.0
7.2 8.3 6.3
高中29.5 26.2 27.7 28.2 P=.878
大专28.2 31.7 28.2 30.5
本科以上36.2 34.8 35.8 35.0
婚姻状况 未婚74.1 74.6 74.3 69.1 P=.191
已婚25.9 25.4 25.7 30.9
是否独生子女 是 34.2 33.0 36.2 35.0 P=.781
否 65.8 67.0 63.8 65.0
样本规模 (n) (448)(445)(447)(446)
表1的结果表明,我们采用随机化方法所得到的四个组的对象,在各种个人背景特征上几乎完全一样(对城乡背景、职业等特征的交互分析以及对其他问题的交互分析也得到同样结果,只是由于篇幅原因,此处未列出),卡方检验(以及F检验)的结果表明,四组对象之间不存在明显差异。这即是说,可以在一定程度上把四组对象看作完全相同的四个复制品。
正是根据这一结果,可以有下列直接的推论:样本中的四组对象总体上具有相同的心理特征,对于完全相同的问题,比如每月的收入,四组对象总体具有完全一样的心理反应分布,即具有共同的回答倾向,他们回答这一问题的诚实程度和比例是相同的,无论是哭穷还是夸富,四个组之间都不存在显著差别。正是由于随机化方法的运用,使我们有效地控制了各种变量(虽然我们自己也不知道究竟控制了多少种特征或变量,但我们却能肯定地知道,实际上控制了一切变量)。这是本文展开分析的最重要基础之一。
(二)四种不同的测量方法
有了四个完全一样的对象组,只是为我们的特殊实验建立了基础。接下来的任务就是要对不同的组给予不同的“实验刺激”,即使用不同的测量方法。在实际研究中,除了按填空法和区间法分为两组外,考虑到区间法中还有其他一些方面因素的影响,故进一步将区间法分为三种。这样,研究中总共设计了四种不同的测量方法,分别用在四个组中。
区间法第一组测量方法的设计。笔者先依据2000年和2002年在湖北四个城市进行同类调查所得到的青年收入分布的结果,确定了区间法第一组(以下简称为甲组)的测量形式如下:
你每月的收入(包括各种奖金、补贴)在下列哪个范围内?
1.400元及以下2.401-500元
3.501-600元4.601-700元
5.701-800元6.801-900元
7.901-1000元8.1001-1100元
9.1101-1200元10.1201-1300元
11.1301-1400元12.1401-1500元
13.1501-1600元14.1601-1700元
15.1701元以上
这一组范围的特点是起点较低,400元;间距很小,100元;区间数量很多,共15组。目的是希望得到比较精确的测量结果。
区间法第二组(乙组)的设计在整体上与甲组相同,只是测量的整体范围向右移动了一格,另外,将每一区间的端点由1-0改为0-9。其具体测量形式是:
你每月的收入(包括各种奖金、补贴)在下列哪个范围内?
1.500元以下2.500-599元
3.600-699元4.700-799元
5.800-899元6.900-999元
7.1000-1099元8.1100-1199元
9.1200-1299元10.1300-1399元
11.1400-1499元12.1500-1599元
13.1600-1699元14.1700-1799元
15.1800元以上
进行这种改变的目的主要是想检验这样的假设:回答者或许会选择在整体中比较合适的位置作为答案,而不管自己实际收入处于什么位置。如果是这样,那么就会发生这样的情况:调查者所设计的整体范围的位置,将会对回答者的填答结果产生一定影响——当研究者所设计的整体范围向右移动一格时,其调查结果也将跟随这种范围向右移动一格。
第三组(丙组)与前两组相比,变化主要体现在分组的区间大小上。它将前两组中100元的间隔改为200元的间隔。这种改变是想检验匿名程度对回答的影响,即是否区间越大,回答者回答的真实性会相应提高。区间越小时,测量就越精确,但对于回答者来说,其收入的真实值暴露得就越清楚。而当区间范围越大时,收入值就越模糊,相对而言匿名性也就越大。当然,由于间隔加大,相应地带来了区间数量和整体区间范围的变化——比前两者的区间数量减少了,但所覆盖的范围更大了。其具体形式是:
你每月的收入(包括各种奖金、补贴)在下列哪个范围内?
1.300元以下2.301-500元
3.501-700元4.701-900元
5.901—1100元6.1101—1300元
7.1301—1500元8.1501—1700元
9.1701—1900元10.1901-2100元
11.2101—2300元12.2300元以上
第四组(丁组)则是采用填空法的形式,即:
你每月的收入(包括各种奖金、补贴)大约有多少元?____________
为了从另一个侧面反映四种测量方法的结果之间的一致性状况,我们对四组对象同时询问了他们每个月的消费数量。四组题目的答案形式与上述收入测量的形式完全一样,只是为了避免形成固定的回答倾向,四组都轮换采用了其他组的测量形式(即甲组采用丁组的测量形式,乙组采用甲组的测量形式,丙组采用乙组的测量形式,丁组则采用丙组的测量形式)。
三、结果与分析
(一)相同的对象与不同的结果
笔者首先采用单因素方差分析的方法(ANOVA),比较了四组对象的调查结果,见表2。
表2 四组对象收入测量结果的单因方差分析
均值标准差 N F检验
甲组 1089.82 451.214 437
乙组 1140.66 481.891 439P=.000
丙组 1177.27 621.580 440
丁组 1331.10 845.412 428
总体 1183.89 624.266 1744
表2显示,四组不同测量形式所得到的结果之间存在着明显的差异:它们的均值从1090元到1331元不等,最大差别范围达到240元以上。标准差也相应地由451元到845元不等,差别范围更是达到394元。F检验的结果则表明,四组子样本中所出现的这种均值差异,已经超出了由抽样误差所造成的可能范围。
如果这一结果是确定无疑的,那么,它对社会调查方法来说,将是一种严重的挑战:因为这一结果实际上意味着,四个不同的研究者,采用完全一样的抽样方法,从同一个总体中随机抽取几乎完全一样的样本进行有关收入方面的调查时,其结果会根据他们所采用的具体测量形式的不同而明显不同。这一结果对问卷调查方法的可靠性、准确性都提出了质疑。因为如果情形真是如此,社会调查就与变魔术别无两样了。
同样的测量方法所得到的四组消费结果是否也是如此呢?详见表3。
表3 四组对象每月消费测量结果的单因方差分析
均值标准差 N
F检验
甲组(丁组收入方式)784.37 554.716 418
乙组(甲组收入方式)751.81 399.257 441 =.761
丙组(乙组收入方式)776.17 380.181 447
丁组(丙组收入方式)770.85 497.502 426
总体 770.64 461.7321752
表3结果表明,尽管四组样本的消费均值上(以及标准差上)也存在一定的差异,但一方面这种差异的范围很小(消费均值最大相差仅32元,标准差相差仅175元),另一方面F检验的结果也表明,四组之间不存在显著的统计差异,样本均值韵差异主要是由随机抽样的误差所导致。
(二)原因分析
为什么采用完全相同的测量方法在四组对象的消费上没有产生显著差异的结果,而在收入上却产生了明显差异的结果呢?问题究竟出在何处?为了探索产生差异的原因,我们先来看看四组收入测量结果的频率分布图(当然也可以看四组的频率分布表,为节省篇幅且为了更加直观,以频率的条形图展示),见图1至图4。
附图
图1 甲组收入分布图
附图
图2 乙组收入分布图
附图
图3 丙组收入分布图
附图
图4 丁组收入分布图
从图1至图3中我们看到,三图最右边都有一个十分突出的矩形条,图2左边也有一个突出的矩形条,这是调查中采用区间法测量收入时最容易产生的一种现象。因为区间法总有一个最低的组别和一个最高的组别,比如说400元以下、1700元以上,500元以下、1800元以上,300元以下、2300元以上等等。所有收入低于或高于这些数字的被调查者都只能选择端点项。当分组不合适时,聚集在端点组(特别是高端点组)的个案数目就会很多,上述情况就必然出现。我们将这一现象称作区间法的“端点累积”现象。可以看出,在甲组和乙组中,端点累积现象十分严重,其比例都接近20%。丙组的累积比例也接近10%。同时,乙组图中左边也出现了端点累积现象。累积比例也超过了10%,其原因显然是由于端点提高后造成的端点堆积现象。
从图4中,我们看到的分布则与前三者大不相同,图4的分布十分零散且无规律。但特别醒目的是在若干整数点上,比如1000元、2000元以及1500元,累积的个案很多(矩形条很突出)。我们将这一现象称作填空法的“特殊整数点累积”现象。矩形条很细是因为不同取值的数目太多的缘故。
通过观察四组的矩形图,我们猜测,或许是由于区间法的“端点累积”现象导致了四组收入均值的明显差异。因为甲、乙、丙组都存在一部分最高收入者的收入并不清楚的情况,并且无论他们的收入是2500元、2800元,还是3000元、4000元,在编码统计时都是分别采用1750、1850和2250来代替的。这样做实际上缩小了调查对象的真实收入情况。因此,我们需要采用替代的办法,将区间法三组中的“端点累积”现象还原为正常分布情况。而由于四个组之间不存在显著差别,所以,可以采取某种替代的方法来恢复这一部分对象的实际收入水平。
(三)数据调整
为进行这种替代,先列出四组累计百分比的分布,见表4。
表4 四组分收入段的累计百分比
月收入段 甲组 乙组 月收入段 丙组 丁组
(n=437)
(n=439)
(n=440)(n=428)
350元
4.8
1.6
450元
9.6 11.2 400元 11.84.2
550元
15.3 17.3 500元 11.4
650元
21.7 23.9 600元 27.3
17.5
750元
34.6 29.4 700元 22.9
850元
40.0 35.8 800元 41.4
30.8
950元
46.9 42.4 900元 35.3
1050元 55.1 50.8 1000元 53.4
55.8
1150元 61.1 58.3 1100元56.8
1250元 66.8 64.5 1200元 63.2
60.3
1350元 69.8 68.6 1300元61.9
1450元 74.8 71.8 1400元 73.0
63.1
1550元 78.5 76.8 1500元70.6
1650元 81.0 78.1 1600元 79.5
72.2
1700元以上
100.0 80.6 1700元74.5
1800元以上100.0 1800元 82.7
76.9
1900元
77.3
2000元 87.3 88.8
2100元
89.0
2200元 90.7 89.3
2300元100.0 89.5
以上
2400元 100.0
以上
月收入均值1090 1140 1178 1331
调整后均值1265 1295 1260 1331
实际操作中,我们先用丁组最后9.3%的对象(即最高收入的41人)的实际收入来恢复丙组最后9.3%的对象的收入水平。比如,丁组中,最后41个对象的收入分布是:2400元有1人,2500元有10人,3000元有17人,3200元有1人,3500元有2人,4000元有4人,5000元有6人。而丙组中最后41个对象的收入则全部都是用3400元来统计的。由于四个组的对象在所有特征方面基本相同,因此,用2400元来统计时,显然实际上降低了丙组的均值水平。我们通过下列计算对此进行调整。
先计算出二者这一部分对象的收入总额和差距:
丁组-丙组=(2400×1+2500×10+3000×17+3200×1+3500×2+4000×4+5000×6)-(2400×41)
=134600-98400
=36200
即丙组最高部分对象实际上少算了36200元。这样,丙组的平均值上相应少了
36200÷440=82.27元
因此,应该在丙组的均值上加上这一部分均值。这样,丙组调整后的收入均值为:
1177.27+82.27=1259.54元≈1260元
采用完全一样的方法,推算出乙组和甲组调整后的收入均值分别为:
乙组1140.66+153.87=1294.53元≈1295元
甲组1089.82+175.17=1264.99≈1265元
这样,四个组实际的均值分别为:1265、1295、1260、1331;四组之间的最大差距范围大大缩小,仅为71元。
(四)相同的对象与相同的结果
虽然可以看到,调整之后四组之间的均值差异缩小了(由原来的241元减少到现在的71元),但仍然不知道,调整后的这种差异是否具有统计意义,即究竟是由于随机抽样误差造成的,还是由于这四个组实际测量结果上存在着明显差别所造成的。为此,我们还需要进行单因素方差分析。将前三组累积部分的数据用丁组的数据进行替代,然后进行单因素方差分析,结果如表5。
表5 调整后四组收入的单因方差分析结果
均值 标准差 NF检验
甲组1264.99838.986 437
乙组1294.53830.198 439 P=.572
丙组1259.55847.400 440
丁组1331.45845.659 428
总体1287.82840.6551744
表5的结果表明,当我们通过调整,将区间法的“端点累积”现象化解掉时,四组测量结果之间的统计显著性差异也随之消失了。方差分析的结果表明,四组测量结果基本相同,相互之间不存在显著的差异。
表5的结果同时还表明:(1)当区间向右位移一格时(即测量方式由甲组变成乙组时),均值略有增加(30元左右),说明不同区间的起始点和结束点可能对回答结果具有一些小的影响,但并不会完全向右增加一格的大小(100元);(2)当间隔的大小变动不太大时(由100元变为200元),对均值的影响不大(与甲组相比,丙组均值基本上也没有位移);(3)填空法的均值最大,标准差也最大,分布的跳跃性和离散程度都比较大。
四、结论与讨论
(一)研究的结论
研究表明,社会调查中两种常用的收入测量方法具有不同的特点:区间法的优点是测量结果的分布比较均匀,同时由于匿名程度相对较高,回答者填答的心理压力相对较小。其主要缺点是容易出现“端点堆积”现象,特别是当区间覆盖的总体范围不够大时,这种堆积现象就更为严重,并会给测量结果带来较大的误差;填空法设计简单,所得结果的分布相对接近现实,但测量结果的跳跃性较大、整体分布不均匀,容易出现“特殊整数点堆积”现象。同时,由于匿名程度相对较低,回答者的心理压力相对较大,所以回答率会有所降低。
研究还表明,对于同一组对象,当我们采用不同的收入测量方法进行调查时,所得到的样本收入均值常常会存在显著的差别。造成这种显著差别的主要原因,是区间法所具有的“端点堆积:现象的影响。只有在区间法不存在“端点堆积”现象的前提下,两种收入测量方法所得的收入均值之间才不会存在显著的差别。
(二)有关问题的讨论
1.区间法“端点堆积”问题。研究发现,“端点堆积”现象是使用区间法时非常容易出现的一个问题。特别是在高收入部分,由于数据相对分散,跨度非常大,而区间数量有限,“端点堆积”现象更容易产生。比如本次调查中,三组区间法高收入部分的堆积比例分别为19.0%、19.4%和9.3%。被调查对象收入差别范围越大,区间所覆盖的总体范围越小时,区间法存在堆积问题的可能性就越大,对收入均值的估计误差也越大。本研究的消费测量中,虽然区间总的覆盖范围没有变,但由于对象实际消费分布的区间范围相对较小,所以端点堆积的比例均在5%以下,对样本均值的影响不大。这一结果启示我们:要正确运用区间法,必须采取措施消除“端点堆积”现象。
2.区间法测量结果的影响因素。对于区间法来说,起始点与终结点的确定、区间间隔的大小、闭区间数目的多少、全部闭区间所覆盖的总体范围大小等因素,都可能对测量结果产生一定影响。而上述这些因素相互之间又存在一定的联系和制约关系。这种关系可以简单表示如下:
高端点-低端点=全部闭区间所覆盖的总体范围=区间间隔的大小×闭区间数量
通常,样本收入的整体范围是一定的,比如本研究中的300元到5000元,研究者的任务就是设计出合适的区间间隔和区间数量。区间的间隔太大,区间数目过少,则区分不精确,有时甚至会失去区分作用,如本研究中,若按500一档划分,则第二档500-1000元就占了近50%的比例,达不到区分的效果。反过来,如果区间间隔小,为了兼顾到整体范围,就只能增加区间数量,而这就会增加填答的负担,有时也会增加测量误差。端点定得不恰当,就会造成堆积现象;区间间隔越小,测量相对精确,但同时也会导致整体区间范围较小,容易形成端点堆积现象;并且,区间数量也往往越多,不利于回答者选择;而当区间间隔增大时,总体区间覆盖的范围同时扩大,区间数目相应减少,既可以帮助消除端点堆积现象,同时又便于回答者填答。但问题是当区间间隔增大时,测量的精确性相对减小,同时,区间间隔增大时,匿名程度也会相应增大,回答的偏误可能会有所增加。
在本研究中,甲组:1700元—400元=1300元=100元×13
乙组:1800元-500元=1300元=100元×13
丙组:2300元-300元=2000元=200元×10
甲乙两组虽然起始点与终结点有所不同,但区间间隔相同、区间数目相同,因而区间所覆盖的总体范围相同。相比之下,丙组虽然闭区间数目少于前两者,但由于其区间间隔大,所以其覆盖的总体范围要大于甲乙两组。全部闭区间所覆盖的总体范围越大,“端点堆积”现象往往就越小。故丙组的“端点堆积”状况明显好于甲乙两组。
3.填空法“特殊整数点堆积”问题。研究发现,填空法中最容易出现的一个问题是“特殊整数点堆积”现象。也可以说,填空法具有某种“整点效应”——在某些特定的整数点上,比如1000元、2000元等,往往会出现超出正常比例的堆积现象。造成这一现象的原因,主要是回答者中往往会有一部分人“有意或无意地”、“自觉或不自觉地”将自己实际略多于(或少于)这些整数点的收入“简化为”这一整数点。这种“特殊整数点堆积”现象对数据分布的影响较大,在进行统计分析时,也会由于这些特殊整数点的个案数目过多而影响到分析的结果。此外,对于这一现象,也很难采用其他方法对数据进行调整。
(三)实际应用的建议
1.关于两种测量方法的选择。客观上,每个被调查对象都有确定的、明确的收入数字,比如说468元、2317元,或者5729元等。从理论上说,或者从理想状态看,我们可以通过询问被调查对象得到这些数字。但是,实际调查中所得到的很可能是400元、2000元,或者5000元等。有哪些因素使我们得不到客观、准确的数字呢?一种情况是,被调查者自己也不确切地知道其收入的准确数字(这可能是大多数人的实际情况)。对于这种情况,两种方法都无法得到正确的结果。另一种情况是,面对调查,回答者受到心理因素的影响,有意识或无意识地谎报数字(这也是相当一部分人的实际情况)。对于这种情况,填空法所带来的心理压力相对较大,因而其面临回答率较低的风险也更大一些。比如本研究的统计表明,填空法在收入测量中无回答比例为4%,在消费测量中无回答比例为7%;而区间法中无回答比例则相对较小(收入中无回答比例在2.5%以下,消费中无回答比例在1%以下)。这还是对相对来说不太在意的青年职工的调查结果,笔者估计,对普通成年居民进行调查时,填空法与区间法之间在无回答比例方面的差距可能会更大。因此,在这方面区间法要优于填空法。
从前面对两种方法所具有的特征的比较来看,填空法所得到的分布实际上是较差的,即较难反映总体实际分布状况。同时,表1中丁组的标准差最大,也反映出其分布的离散程度最大。因此在这方面,填空法也不如区间法。另外,当我们采用区间法时虽然存在着“端点堆积”的风险,然而,这种“端点堆积”现象是可以通过合理的设计来减小和消除的。而填空法的“特殊整数点堆积”现象却无法通过设计的手段来加以消除。所以,综合上述分析,笔者认为区间法要优于填空法。在实际研究中,笔者建议采用区间法,但同时要避免区间法的缺陷。
2.关于区间法的设计建议。在社会调查中测量人们的收入时,为了避免区间法的缺陷,使区间法达到较好效果,笔者建议:
第一,在设计具体的收入区间、收入范围之前,先采用填空法在试调查中收集和了解所调查总体人们收入状况的大致分布。然后根据这种分布的状况来设计正式调查所用区间法的整体区间范围及其端点、区间间隔等。
第二,对于区间法的最大缺陷——“端点堆积”现象,设计时可采取两种方法来解决:
一种是不均匀的区间法。即根据试调查结果所显示的收入分布状况,设计出大小不等的区间间隔,完全依据实际收入分布的结构来设置区间及其范围大小。这种设计的思路可以称为“非统一性区间设计”。实际上,人们习惯的思维方式是将前述“总体区间所覆盖的范围=区间间隔的大小×闭区间数量”公式中的“区间间隔的大小”变量看作是统一的。然而真正合适的方式则是:区间间隔的大小具有非统一性,即有的区间间隔大,有的区间间隔小。正是区间间隔的非统一性将带来测量和分布的合理性。这种非统一性可以在不增加区间数目的前提下,通过不一致的区间间隔(而不是统一的区间间隔)来达到既较好地反映不同收入段的比例分布、又在有限的区间中覆盖整体范围的目的。比如,在本研究中,合适的区间划分方式可以是:
1.400元及以下2.401-500元
3.501-700元4.701-900元
5.901-1100元6.1101-1400元
7.1401-1700元8.1701-2000元
9.2001-2500元10.2501-3000元
11.3001-4000元12.4000元以上
这样设计时,区间数目相对较少(12个),覆盖范围相对较大(4000-400=3600元,覆盖了对象实际收入范围的93.6%),分布也非常均匀,每一区间的百分比基本上在5%至15%之间。得到这一结果应主要归功于区间间隔不断变化(从100元到200元、300元、500元和1000元不等)。
另一种是将区间法与填空法结合起来使用。即在一般分布上,采用上述区间法设计,而在区间法高端的端点上则采用填空法设计。比如在本研究中,可以按下列方法来设置:
1.400元及以下2.401-500元
3.501-700元4.701-900元
5.901-1100元6.1101-1400元
7.1401-1700元8.1701-2000元
9.2001-2500元
10.若在2500元以上,请填写具体数字______元
这样做的好处是,总的区间数目更少,但对于高收入的人的测量又相对准确,不会形成端点堆积现象。
第三,在设计区间法时,除了列出所有区间外,最好还增加“不回答”、“不知道”、“不适用”三个答案。这样设计的理由是:与其让那些不愿回答、不知道该如何回答,以及实际上不应该回答的人去乱填答,还不如将他们明确归类。其中,那些不愿回答和不知道该如何回答者的数据,在有的情况下还可以通过采用某种替代技术进行弥补(通过计算与他们有着相同社会背景,即有着相同职业、年龄、文化、性别、级别的人的收入均值来替代)。
最后需要说明的是,本研究的数据和结果是以城市在职青年为调查对象得到的,对于一般城市居民或更广泛的总体是否同样适用,或许还需要进一步的实验证据。