反思“观念调查”,本文主要内容关键词为:观念论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
大多数社会学的问卷调查都是针对“人类行为与行为的结果(事实)”,但是也有相当多的问卷调查是为了研究“观念”,包括态度、意愿、评价等等;有些是在问卷中设置某些提问;有些则是设计出专门的观念调查问卷。由于这些年来中国人在各个方面的观念变化相当急剧,所以做这方面研究的人也就越来越多。
一、观念调查不符合问卷调查的基本要求
笔者根据以往调查的经验与教训,强烈地认为:问卷调查基本上不适用于直接地单独地研究这类观念的问题(无论使用专门的问卷还是在其他类型的问卷中设置某些提问),因为它很难获得真实的回答。
首先,由于社会学的问卷调查是模仿自然科学,因此都要求被调查者的回答尽可能地实现“单纯化”,就是需要排除任何其他因素对于被调查者的作用。可是这在观念调查中是基本上做不到的。
如果我们使用开放题来进行调查(笔者并不同意这样做),除了我们前面论述过的那些调查性质的改变之外,在我们中国的现实情境之中,我们真的能够排除人们那些已经内化为民族习惯的各式各样的生存策略与生活选择吗?例如:人云亦云、随大流、道听途说、见什么人说什么话、见人只说三分话、该说的才说、莫谈国事、嘴上把门等等。
即使我们使用封闭题来调查,在中国情境中也等于是调查员处于强势地位,强迫被调查者表态;因此所获得的信息的真实程度非常值得怀疑。尤其是对于社会敏感问题进行的观念调查,其结果在目前中国基本上不可信。有的学者调查中国人的政治态度,问人家“拥护不拥护”这样的高度敏感的问题,这对于中国相当多的人口来说毫无意义,因为很少有人能够在这种情况下自由表达,你若是强迫他表态,那他只能表一个社会所能接受的态。这样一来,这个观念调查的结果就出现了一面倒。
其次,任何问卷调查也都要求尽可能地“实验室化”,就是排除调查所在地的情境对于回答结果的影响。可是如果我们使用问卷调查,就变成在特定语境中的言说。所以语境和言说都在极大地影响着我们所获得的资料。我们在日常生活中都知道,同样的一个提问,你在大街上问我,跟在单位里当众问我,跟在家里私下问我,我的回答肯定是不一样的。那么,我们有多大的可能性把成百上千的被调查者置于统一的情境之中来回答我们的提问呢?如果做不好,那么我们所获得的数据的意义就不得不大打折扣。
第三,任何问卷调查也都要求尽可能地“标准化”,就是排除调查员自己的任何表现对于回答结果的影响。可是,哪怕是最简单的问卷调查,也仍然需要一个调查员直接地面对面地提问,也仍然是一种人际互动。调查员的言行举止不可避免地会影响到被调查者的回答结果,甚至调查员的衣着打扮也会产生很大的影响。可是,我们真的能够把每一个调查员的声调、语调、重音、表情、形体动作、言外之意等等,都统一起来吗?
当然,说这些,绝不是要禁止使用问卷来调查“观念”,而是强烈地建议:如果我们没有把握在上述这些方面做到足够好,那么最好慎用问卷调查的方法。即使我们不得不进行观念调查,那么最好在调查报告中讨论一下自己在这些方面的选择与努力。否则,我们就有可能堕落到“调查游戏”的低水平上去了。
二、观念调查问卷设计的原则
如果我们必须进行观念调查,那么在设计问卷时,首先需要考虑以下各点。
1.观念的持续期
所谓“观念”,其实就是人的想法,但人的想法是会变的,不但一生中会变,就是一天中也可能变;不但会小变,还有可能剧变。因此我们使用问卷调查到的任何一种观念的状况,其实都是被调查者此时此刻的想法。彼时彼刻其想法会不会改变,会变成什么样,我们不可能知道,也没有什么手段足以去预测或修正。
这就要求我们必须在此前研究的基础上,慎重地思考与检验一下,我们准备调查的那些观念的“持续期”究竟有多长,与我们预计要说明的问题的“存在期”是否配套?例如对于任何一种具体的社会现象的类似民意测验那样的观念调查,不仅在操作上必须是“短平快”,而且在设计问卷的时候就应该意识到,它的意义往往只能用“月”来计算。如果我们希望了解的是类似“社会态度”那样的基本观念,那么就应该设计出足以按照“年”甚至“代”来计算的问题与问卷。
笔者在2000年与2006年分别进行的对于中国人的性行为的调查①中充分考虑到这一点,因此在“性脚本”(性观念)部分的所有提问所针对的观念,都是笔者预计至少在“5岁的年龄段”内不大会出现剧变的。当然,目前中国社会学界对于“观念的持续期”的研究尚不多见,这制约了笔者的设计。笔者渴望尽快见到这方面的可操作成果。
2.观念的层次
即使是仅仅针对一个问题或者现象,人们的观念也一定是多层次的。笔者相当武断地提出(以期引起讨论)如下的最低限度的分层。
最大的观念是意识形态或者信仰,也可以叫做“元观念”。一般来说,它是清晰的、坚定的、持续的。它离一般人的日常生活比较远,也很不容易表述清楚;但是它却是人们做出选择时的主要根据之一。尤其是,无论在什么方面,成年人其实都有这样的意识形态,所谓“无信仰者”或者“活得不明不白的人”并不存在,往往仅仅是因为调查者无法明白其内容或者其表达方式,才这么说的。
再往下的一个层次叫“外指观念”,就是中国语境中一般人常说的“道德观念”。之所以说它是“外指”,是因为它一般是人们针对各种社会现象所产生的一些看法、评价等等;往往并不直接针对自己。
第三个层次是“内指观念”,大体上相当于中国人说的“生活态度”。它主要反映的是人们在可能涉及到自己的时候对于比较具体的问题的看法。
第四个层次则是“生活策略考虑”,可以相当于人们的“实际打算”。它往往是人们自己在遇到某些非常具体的事务时的选择倾向。
在一个人的头脑里,这四个层次的想法不一定会划分得很清楚,但是在这个人的生活实践中,大多数情况下是可以从其结果上看出来的。以笔者的“性调查”的结果为例,确实有一些人在意识形态的层次上信仰某种宗教;在“外指观念”上反对非婚性行为;但是在“内指观念”的层次上却同意“有爱就可以有性”;在“策略考虑”的层次上又认为自己的个人魅力比较大;结果他们就有过一个以上的性伴侣。也就是说,不同层次的观念对于人的行为的影响,不仅是不同的而且可以是相互矛盾的,人们实际上是经过选择的。
那么,对于问卷设计者来说,即使仅仅是调查单纯的“观念状况”,也不得不首先想清楚我们究竟准备调查哪一个层次上的观念呢?哪一个层次对于我们想说明或者揭示的问题更加具有解释力呢?
一般来说,“短平快”的类似民意测验的观念调查,应该仅仅局限在同一个层次的范围之内。即使希望进行全面的观念调查,也需要精细地分层(不一定按照笔者的说法),才能考察到不同层次的观念之间的不同关系与相互作用,才能事半功倍,扩大自己的观念调查的价值与意义。如果准备把观念与行为联系起来考察其相互关系,那么就更需要慎之又慎,因为我们对于观念的任何一种分层都会直接影响到统计分析结果。
如果缺乏了这个设计环节或者没有解决好;如果把这四个层次混在一起提问,那么观念调查的结果就很可能变成“以其昏昏,使人昭昭”;观念与行为的交互分析更是很可能把我们引入歧途。
在这方面,笔者的“性调查”既有经验又有教训。在问卷中,笔者基本上是按照上述四个层次来设置各个提问的,每个层次有两个提问,而且在统计分析中也获得了很好的检验效果。但是在2000年的问卷中,在考察“社会性别观念”这个方面的时候,笔者所设置的两个提问却不够理想,与笔者的几个目标变量的相关关系没有得到充分的检验。虽然在2006年再次进行调查的问卷中加以修订,但其效果仍不够理想。究其原因,最根本的还是因为笔者自己对于“社会性别观念”的分层不很清晰,没有很好地界定这个方面的四个层次及其相互关系。
3.观念调查结果的意义
谈到观念调查,人们经常举出西方对于选举结果的民意预测作为其可行性的例证。但是我们一定不应该忽视了:那种观念调查的结果是可以及时地得以验证的,而且可以通过一次又一次的选举结果来不断地修正原始问卷,因此它才是有效的。可是我们中国目前所见到的大多数观念调查,其结果都是无法验证的,至少也是很少有人真的去验证。例如“就业观念”与“就业结果”之间当然存在着许多“中间因素”;但是如果我们社会学还没有把观念与结果这一头一尾进行对照调查,那么我们不仅无法提出对于那些“中间因素”的相关假设,而且无法知道观念调查的结果究竟有多少意义。
虽然我们不可能要求每一个观念调查都用行为的结果来加以验证,但是在观念调查问卷的设计中,我们却可以而且应该增设一些“测谎题”。虽然它们仍然不能告诉我们真实的观念是什么,但是可以告诉我们哪些回答是不值得相信的,从而减少调查误差。虽然它们不一定总是能够测出真正的“谎答”,却足以帮助我们发现一些我们原来并不知道的各种观念之间的矛盾之处,从而促进我们进一步发掘这方面的研究素材,乃至提出新的相关假设。
4.观念调查的主要用途
作为社会学的调查,观念调查应该主要用于考察在一定的相关假设之中的观念与行为之间的相互关系。在这样的调查之中,一方面作为百分比调查或者分布调查,我们完全可以获得相当多的“观念”的调查结果;另一方面,我们又可以在分析“行为”与“观念”的相互关系中,极大地加深对于“观念”的理解。例如笔者在“性调查”中发现,年轻男性的所谓“处女情结”的百分比虽然确实比较高,但是这与他们选择女性性伴侣的实际结果之间其实并不存在显著的相关。这样,笔者就可以理解,被表达出来的“外指观念”层次上的“处女情结”,其实并不像表面上那样强大与有效。这样就可以进一步思考:那么“处女情结”为什么又会被如此气势汹汹地、信誓旦旦地表达出来呢?背后的客观社会背景与主体建构过程又是怎样的呢?这样,笔者的思考就发展了,笔者的研究也才会发展。
因此笔者建议,即使是单纯的观念调查,即使不需要考察行为,那也还是增加一两个关键行为的测定提问为好。
三、操作建议
无论是否需要达到社会学的调查的层次,凡是观念调查都必须注意一些基本问题。这方面,许多教科书与学术文献中都有过论述,笔者就不再重复。此处,笔者根据自己的切身经验,仅仅提出最有心得的几点建议。
1.高层观念,要能够问得出来
尤其是在意识形态或者信仰这个最高层次上,除非社会上已经有一个达到广泛共识的说法,②否则要把我们的提问说清楚,还真不是一件容易的事情。
例如,在笔者的“性调查”中,“男主外,女主内”这样一个传统的社会性别观念是非常重要的,笔者也假设它与人们的行为有相关关系。可是如果笔者仅仅简单地提问:“您同意男主外,女主内这种说法吗?”那么城市青年中或者低文化人群中就很可能有相当一批人不明白笔者在问什么,或者他们对于“男主外,女主内”有着笔者所不知道的理解。笔者在问卷中是这样询问被调查者的:“有人说,对妻子来说,主要应该以家庭为重;对丈夫来说,应该主要以事业为重(就是“男主外,女主内”)。您同意这种说法吗?”
可是统计分析结果表明,这个变量对于笔者的几个目标变量的解释力仍然不够充足。除去其他的可能原因之外,笔者不得不怀疑,笔者的如上提问,仍然存在着表达不清楚或者不贴切的较大可能性。
2.道德观念,最好讲故事
对于“外指观念”(道德观念),泛泛的提问是效果最差的,因为人们对于事情发生的背景、过程与结果知道得越多,做出的道德判断才能越准确、越真心。例如同样是对于“一夜情”的道德评判,外国人发生的与中国人的不一样;同龄人之间发生的与涉及未成年人的也不一样;结局美满的与闹翻天的又不一样。如果仅仅询问“您对一夜情的看法”,那么我们所得到的回答很可能仅仅是对于这个概念(名词)的道德判断,而不是对于这个事实(行为)的看法。
笔者建议最好给被调查者讲一段故事,不是长篇大论、有头有尾的故事,而是故事化的一段话,人家才能够知道你到底在问什么。例如我们可以这样来提问:“一个已婚的男人与一个未婚的女性自愿发生了‘一夜情’,没有经济来往,没有后果,也没有别人知道。您认为在道德上应该如何评价这件事情?”
这样的“讲故事法”的优点是可以更加准确地了解到人们对于一个情境化的事实的道德判断。当然它也有局限性,就是故事的情境越细化,那么对于这个故事的回答就越不能推论其他的哪怕是稍有不同的情况。可是,这个局限性是可以充分地消解的。我们可以根据自己所要考察的主要目标,尽量多地设置一些不同的情境与故事,来分别考察人们对于同一个问题的道德判断。例如上述的“一夜情”的故事,只要改变其中的任何一个要素,就可以成为不同的故事。这样,虽然提问的数目增加了,但是我们对于问题的理解也更加广阔与深入了。尤其是,我们宁可只得到一些虽然狭窄些但是更加深入些的回答,也不愿意让那些大而不当的提问把被调查者与我们自己都引入云山雾罩的境地。
3.观念调查,最好是照本宣科
前面说过,问卷调查是一种人际互动,调查员对于被调查者的回答是有影响的。这在观念调查里尤其突出。试想,如果一个人用一种不够正经的口气来谈论一个其实很正经的问题,再问您的看法,您还会如实回答吗?因此,调查者在设计观念调查的问卷的时候,就必须规定调查员使用什么样的方法来操作这个观念调查。因为这关系到整个调查的质量高低,甚至关系到调查该不该开始做。
从最理想的状态出发,笔者建议观念调查最好是使用“照本宣科”的方法,就是对于调查员,不但问卷中的任何一个字都不许改,甚至连声调、语调都做出严格的限定,例如只能用平调,不许用升调降调,或者只能用降调等等。因为同样的一句话,调查员用不同的声调念出来,对方就很可能做出不同的回答。这个要求,越是针对敏感的问题就越要坚持。它虽然要求我们更多地培训调查员,但是为了保障学术研究的质量还是很值得的。
笔者在“性调查”中使用笔记本电脑进行调查的好处之一也在于此。提问被转化为出现在电脑屏幕上的文字,而不是调查员的直接口头表述,不但调查员的干扰被降到了最低,而且提问本身的敏感性也被降到了最低。毕竟,有一些性行为方面的词汇,许多人就连听都不愿意听,可是阅读一下却是可以容忍的。
“照本宣科”的方法也有另外一个好处,就是可以化解一个观念调查中经常遇到的难题:调查员究竟应该仅仅记录被调查者的第一反应,还是允许被调查者修改自己的选择?③
就事论事地来看,两种方法谁也说服不了谁。第一反应可能是类似“本能的”,可能更准确;但是对于第一反应的修改也同样可能是更加深思熟虑的、更加真实的。其实,这两个办法之间的区别不在于调查员应该记录什么,而在于问卷设计者允许不允许调查员与被调查者互相讨论。如果允许,那就是向着定性访谈靠近,那就应该是双方充分讨论之后,共同决定一个答案。可惜,这等于把调查质量的决定权完全下放给那些不一定合格的调查员。即使我们真的有这么多合格的调查员,在任何规模较大的调查中,与其如此费时费力,还不如我们另外组织一次更加纯粹的定性调查。
如果我们使用“照本宣科”的方法,那么就简单了:由于我们不但不允许讨论,而且连声调和语调都规定死了,因此我们必须要求调查员仅仅记录被调查者的第一反应。即使被调查者提出修改,也仅仅是作为额外记录,在统计分析的时候加以参考而已。
“照本宣科”的方法还有一个好处,虽然不太显著:这可以在一定限度上有意营造统一的调查情境。
在理想状态下,观念调查在操作的时候的情境应该是统一的,这样才能尽可能地减少“到什么山唱什么歌”这种生活习惯的干扰。否则,在不同的情境中所获得的数据会缺乏统一性,放在一起来统计就多少有些勉强。笔者在“性调查”里统一规定:调查必须是在被调查者的住处之外、封闭的房间里、一对一没有别人地进行。这样的规定,除了为了更加保密之外,就是为了尽可能地把对于数千人的调查的情境统一起来。
由于现实的原因,这样的标准很难被很多调查所沿用。那么“照本宣科”的方法就是至少在信息输出这个方面尽可能地走向统一。
4.提问中要尽量弱化“对方指向”
被调查者在回答敏感的观念题的时候,实际上存在着一个类似“文责自负”的顾虑,就是我的任何回答都意味着:这可是我自己的真实想法啊,必要时,我必须对这个回答负责。尤其是问到一些负面的观念时,有些被调查者的这种潜在的“负责焦虑”会相当严重的。例如,如果一个被认为是循规蹈矩的已婚者,却想对调查员表达赞成“一夜情”的态度,那么他(她)的自我心理压力可能不小。因此,如果问卷被设计为鲁莽地直接询问:“您赞成一夜情吗?”那么获得真实回答可能性就会被严重地降低。这种提问方式就是“对方指向”。在某些敏感的被调查者听来,其言外之意就是:我(问卷设计者)可不赞成“一夜情”,如果你(被调查者)非要赞成,那你就去负责任吧。
为了避免这样的局面,笔者强烈建议:把所有的敏感的观念题都写成“有人说……;您认为这种说法对吗?”这样的句式。这样一来,潜在的“文责”就被潜在地转移到一个其实并不存在的“有人说”上面去了。被调查者回答这样的提问就会轻松得多。在笔者的“性调查”里,凡是涉及观念的提问全部采用了这样的句式。这种做法得到了国际同行的好评。④
5.“假设式提问”必须注意观念的层次
“如果你遇到这种情况,你会怎么办?”这是观念调查中经常使用的一种提问方式,以便测定被调查者对于某种比较具体的情况的态度。可是,这种提问方式的前提条件是:我们所假设的情况,是被调查者非常可能遇到的,最好是肯定会遇到的;否则就最好不要这样提问。这是因为,被调查者发生这种情况的可能性越小,他们对于这种情况就越缺乏真实感,所做出的回答就越具有猜测性。
按照笔者前述的观念的至少四个层次,恐怕只有在最低的“生活策略考虑”这个层次上才是合适的。例如,同样是调查“金钱观”这个问题,在最低层次上,我们可以假设地询问对方如果买彩票中了大奖将会怎么使用它。虽然买彩票者在总人口中的比例并不高,但是买彩票这件事情还是广为人知的,因此这个提问的实现可能性还是比较高的。
可是,如上升到“生活态度”的层次上,我们就不得不假设地询问对方“有了很多钱之后会怎么办”。可是相当多的人这辈子也不会有很多钱;结果,有些被调查者只好像网上流传的笑话那样回答我们:“买两碗面条,吃一碗,扔一碗”。
如果再上升到“道德观念”的更高层次,我们的假设式提问就可能变成“您是否同意金钱是万能的这种说法”。那么被调查者的回答早在1990年代就被电视剧的台词给框定了:“金钱不是万能的,可是没钱是万万不能的”。
倘若非要去考察信仰层次上的观念“是否相信金钱最重要”,那么无论对方回答什么,我们都无法知道这个回答与他的实际生活有多大的联系。
进一步说,即使在最低的“生活策略考虑”这个层次上,假设式提问的人口涵盖面也是很成问题的。在上面的例子中,我们其实并不知道有多少中国人穷得根本就不考虑买彩票或者富得不需要考虑。如果我们非要这样提问,对他们就是一种勉强,其回答的意义也就要打折扣。极端地说,即使我们假设地询问被调查者“收入增加之后会做什么”,也不得不考虑到有许多人的收入根本就没有增加的任何可能。
笔者希望,在类似的观念调查中,最好能够在问卷中设计出一种“观念的参照指标”,就是用某些事实(行为)的变量来加权所获得的观念变量的数值。如上例,关于“中大奖后做什么”,我们应该增设“是否买过彩票”的变量。被调查者买过或者没买过,他们对于观念的回答都需要进行加权处理。
6.观念调查,最好不用排序的方法
有些调查者总是想知道,人们的第一位的观念是什么,第二位的是什么,因此就在问卷里设计出排序题来,有人甚至排序排到第十位、第二十位。这样的设计者忽视了一个基本的问题:社会学的调查,最关键的并不是您自己需要了解什么,而是被调查者有可能告诉您什么。除了不愿意回答之外,被调查者有没有足够的能力来回答您的问题,这才是最重要的。
这里笔者谈的不是被调查者的文化水平或者个人素质这样的问题,而是问卷设计者需要理解:在这个世界上,恐怕只有与我们类似的“一小撮人”才会关注我们所提问的现象或者问题,才会经常地思考它,才会有答案,才能在有人询问的时候脱口而出。我们之外的人,有着自己另外的生活,想着自己另外的事情。对于我们所问到的问题,他们很可能从来都没有认真想过,也没有什么现成的答案。可是我们又非要去询问他们,那么,信口开河或者随声附和已经是人家很讲礼貌的反应了。
在这种情况下,如果我们还非要让人家排出序来,真是强人所难。说不好听话,如果有的被调查者真的能够如实排序,那我们就是巧遇专家了。在笔者的“性调查”里,至少有8个直接针对观念的提问。笔者课题组的同仁们曾经自我试验,但是没有一个人能够把它们排出顺序来。
更为根本的问题是:就观念而言,我们怎么知道在现实生活中它们是不是真的可以进行排序?如果我们有根据,那么请在调查报告里面多少提及一下,也让别人学习学习。
7.观念调查,其实无法“总汇”
“总汇”是一种观念调查中时有所见的方法,就是先把小的或者低层次的观念一个一个列出来,最后询问一个总的或者高层次的观念,而且假设其中具有逻辑关系。例如,先问现在社会形势好不好,再问经济形势、治安形势、就业形势等等;最后再问:那么您认为总的形势好不好呢?在这种“总汇”方法中,如果所有的“分题”都回答的是“好”,而“总题”却说“不好”,就会被认为是不合逻辑的,反之亦然;甚至被认为可以起到测谎的作用。
可是,这种“部分与总体相矛盾”的情况虽然不符合数学上的逻辑,但是却很有可能符合生活的逻辑。这是因为:
第一,我们的提问没有也不可能涵盖被调查者的全部生活。例如我们只问了9个方面,而被调查者可能恰恰生活在第10个方面之中。如果这个人是出口商,我们什么都问了,唯独没有问外贸形势,那么他(她)给出的评价当然就不会符合我们所设定的逻辑。
第二,我们无法预先把被调查者的生活赋予权重,可是他(她)自己的心里却很清楚。在日常生活中,人们总是倾向于在对自己最重要的那些事情上做出“一俊遮百丑”式的或者“一个耗子屎坏了一锅汤”式的价值判断。例如,上述的出口商就很可能这样回答:虽然9个方面的形势都很好,但是总的形势却很不好。因为他自己最关注的外贸形势很不好,因此他就会“以偏概全”。
因此说,“总汇”的方法不适用于生活逻辑,社会学研究不应该使用。
本文的结论可以用一句通俗的话来表达:“没有金刚钻,别揽瓷器活”,观念调查其实是社会调查中最难的一种,缺乏经验的人最好不要涉足。
注释:
①《2000年中国成年人的性关系与性行为调查》,《当代中国人的性行为与性关系》,社会科学文献出版社,2004年2月;《2006年中国成年人的“性”调查》,《中国性革命成功的实证:全国成年人口随机抽样调查结果简报,2000年与2006的对照研究》,台湾高雄:万有版社,2008年1月。
②越是抽象的观念,人们对它的理解越容易出现分歧和差异。当然,还存在一些例外,当这类抽象观念人所共知,成为社会共识的时候,我们可以直接用来提问,比如“尊老爱幼”、“为人民服务”、“社会主义”等这些概念。但是,另外一些抽样观念是不可直接用来提问的,这些观念仁者见仁,智者见智,难以有统一认识,直接提问它们不足以收集研究者希望得到的信息。
③对这一问题的讨论,不管坚持何种取向,学者们出发点都在于“从被调查者那里获得真实的信息”,这涉及到何谓真实,判断真实的标准为何等认识论问题。从方法论的角度而言,这涉及访谈员和被访者之间互动深度和层次问题。
④芝加哥大学社会学系的William Parish教授对此好评有加。
标签:问卷调查论文;