中国儿童智力测验的弗林效应及其影响因素_韦氏智力测验论文

中国儿童智力测验的弗林效应及其影响因素,本文主要内容关键词为:中国论文,测验论文,效应论文,因素论文,儿童智力论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       【中图分类号】G405 【文献标识码】A 【文章编号】1005-8427(2016)05-0003-9

       1 前言

       智力测验自20世纪初产生和发展以来,迅速在世界各地得到广泛应用。然而,事实上智力测验的结果不断发生变化,为了使测量结果的平均值保持在100分不变,需要定期修订常模。20世纪80年代,这种智力分数变化的现象受到学者的关注。Lynn早在1982年就发现美国人的智商测试成绩越来越好,并且这种变化是明显的和长期性的,在不少发达国家也存在类似的情况。随后,Flynn(1984,1987)深入研究了1932-1978年美国军队征兵的IQ测验,其结果发现,美国年轻人的IQ平均指数在46年间提高了14点,即下一代年轻人总是比上一代人表现出更优异的IQ平均指数,其增长速度为每10年大约增长3个智商分。随后,他在欧洲的14个发达国家同样也发现了这一规律,这一智力测验结果逐年持续增长的现象,被称作弗林效应(Flynn Effect)。

       弗林效应的提出受到广泛关注,并引发了一场世界性的争论。令研究者们感兴趣的是,在智力分数增加的背后,到底是真实的人类认知能力的提高?还是心理测量技术造成的“人工”效应?众多研究主要集中在两个方面。第一个方面是,由于主流理论认为,IQ指数主要由遗传基因决定,而人类不可能在很短时间内获得如此快的“进化”,于是,有人对弗林效应是否真正存在提出质疑,即是说现代的年轻人是否真比他们的父辈更聪明?针对弗林效应是否真的存在,大量实证研究发现,从广泛程度看,弗林效应是一种在智力测验中普遍存在的现象,它不仅在世界上多种常用的智力测验中存在,如WISC(The Wechsler Intelligence Scale for Children),Ravens,Binet,Shapes,Jenkins,Otis等,而且它涉及的国家和地区几乎遍及世界,不仅包括欧洲、北美洲、大洋洲等众多发达国家,还包括很多发展中国家,如近些年在南美、中东和远东的发展中国家的IQ调查中,也存在弗林效应(Flynn,1987;Flynn,2009a;Lynn & Hampson,1986;Lynn,2009;Lynn,2009;Teasdale & Owen,2005),甚至在非洲肯尼亚乡村儿童的IQ测验研究中,Daley,Whaley,Sigman,Espinosa和Neumann(2003)也发现存在弗林效应。从时间跨度看,有些研究数据的追踪时间长达半个多世纪。Steen(2009)在总结了弗林效应自提出后近30余年的众多研究成果得出结论:大量证据表明,IQ指数的变化是真实和有意义的。然而,近些年在挪威和丹麦等一些北欧国家的研究发现,IQ分数的变化规律并非是一成不变的,如在20世纪50-90年代,IQ指数持续增长的规律符合弗林效应公式,但到90年代中期以后的增长速度逐步变慢,甚至出现负增长(Sundet,Barlaug & Torjussen,2004;Teasdale & Owen,2005,2008)。对这种IQ增益量(IQ gain)下降的趋势,有人认为是天花板效应所致(Wicherts,Dolan,Hessen,Oosterveld,van Baal,Boomsma & Span,2004),还有人则认为是移民导致的,因为移民的IQ测验分数比总体平均值要低(Sundet,Barlaug & Torjussen,2004;Teasdale & Owen,2008)。至此,弗林效应是否还存在再次受到质疑。尽管有人认为这些研究证据过少,不足以充分证明弗林效应的结束,但是,为什么智力分数在不同时段或不同地区和国家的增长规律会不断变化(IQ年增长率大约范围在0.3~0.6)?其产生的原因何在?这是弗林效应研究关注的第二个方面。弗林效应产生的影响因素究竟有哪些?最初Flynn倾向于认为弗林效应是测量技术造成的人工效应,但他在2006年又指出,如果能在真实世界里找到能反映人们认知能力提高的依据,那么,弗林效应反映真实认知能力增加的观点就有其合理性了(Rodgers & Wanstrom,2007)。

       对这一问题的研究和解释尽管存在争议,但就其影响因素的普遍看法主要有两个方面,一个是生物学因素的解释;另一个是来自环境因素(社会和教育变化等)的解释(Neisser,1998)。生物学方面的原因包括:营养状况和卫生条件的改善、遗传基因的变化等。如Sundet等人(2004)用身高作为营养状况的指标,发现挪威人的认知测验分数与身高的变化趋势是一致的,其结果支持营养改善说。Lynn(2009)在对2岁以下婴儿的智力测验的研究,也发现存在弗林效应。他认为,在婴儿出生前及出生后的营养状况至关重要,它不仅直接影响着2岁以下婴幼儿发展商数(Development Quotient,DQ)的增加量,而且还影响学前儿童、在校学生和成人IQ分数的增量,其结果支持产生弗林效应是由于出生前以及出生早期营养状况的改善,而不是环境因素影响的结论。

       环境因素的主要原因有:家庭结构的变化,教养方式,教育的影响,社会环境等。很多研究者认为,受教育水平的提高是弗林效应的主要原因(Teasdale & Owen,2008;Ronnlund & Nilsson,2008;Lynn,2009)。再者,小规模家庭在整个社会中所占比例增大,由于在小规模家庭里,子女可以享受更好的教育资源、得到父母更多的关注等也是导致弗林效应的原因之一(Sundet & Borren,2008)。

       近些年,有人综合了生物和环境两方面的因素来解释弗林效应。Ronnlund等人(2008)的研究发现,教育、身高、家庭结构的变化可以解释94%的认知测验分数的变异。Steen(2009)认为,要回答这一问题,需要从四个方面来考虑:医学环境(包括改善营养、健康和避免环境危害)、社会环境(包括改善教育、良好的家庭教养及早期儿童的教养)、信息化环境(包括接受更多更复杂的信息)和遗传环境(包括更好的加速进化的基因);Blair,Gamson,Thorne和Baker(2005)从对儿童的数学教育的认知需求、群体接受正规学校教育和前额叶皮层的神经生物学三个方面,解释了100年来导致美国人的平均IQ成绩持续增加可能的原因。原因有二:一是,接受小学低年级的学校教育带来的长期变化;二是,接受与IQ测验成绩相关的大脑前额叶皮层的流体认知功能的教育实践活动带来的变化。

       中国作为世界上人口最多的发展中国家,14岁以下的儿童大约有2.2亿人,占全国人口的16.6%(中国国家统计局,2011)。自20世纪70年代末,中国实行改革开放以来,在短短30多年的时间里,中国社会和经济发生了前所未有的巨大变化,与30多年前相比,在不同地区,社会经济和文化教育方面产生的差距对中国儿童的IQ增长能够产生多大的影响?中国儿童智力测验是否存在弗林效应以及它的增益量有多大?本文通过两个研究回答上述问题。在研究1中,我们采用中国大陆和中国香港、中国台湾地区与美国的两个时期出版的韦氏儿童智力测验数据进行比较,考察中国儿童智力测验是否存在弗林效应;在研究2中,我们采用2006年修订的WISC-Ⅳ(中文版)的数据,比较中国大陆不同地区儿童智力水平是否存在差异,并探讨其形成智力水平差异的原因。

       2 研究1

       研究1的目的:根据Flynn效应的增长规律,通过分析和比较中国不同地区并参考美国的WISC数据,考查是否存在弗林效应。

       2.1 研究方法

       2.1.1 样本数据来源和研究工具

       研究1样本来源包括:(1)在修订WISC-Ⅳ中文版标准化过程中,为做效度检验获得中国(包括大陆和香港地区)的WISC-Ⅳ(2006,W4)和WISCⅡ(1982,W2)两次测验的数据。抽样采用随机整群抽取方法,两个量表的施测均采用分半方法,即将全部题目按奇、偶数分为两部分施测,问卷统一发放和回收,施测时间约1小时。中国的W4和W2两次测验的Cronbach’s Alpha分别为.86和.80,两次测验总智商分的相关系数r=.74,p<.001。

       (2)中国台湾地区和参照组美国的WISC-Ⅳ(2003,W4)和WISC-Ⅲ(1991,W3)两次测验数据由美国培生测验公司提供,施测方法同上。中国台湾地区的W4和W3两次测验的Cronbach’s Alpha分别为.87和.85,总智商分的相关系数r=.77,p<.001;美国W4和W3两次测验的Cronbach’s Alpha分别为.77和.82,总智商分的相关系数r=.83,p<.001,均有较高的信效度。

      

       2.1.2 样本分布

       样本共170名中国儿童,包括87名男童和83名女童,其中来自中国大陆和中国香港110人,中国台湾地区60人,其平均年龄为10.72岁,标准差2.85。

       2.2 结果与统计分析

       2.2.1 中国WISC-Ⅳ和WISC-Ⅱ的IQ总分增益量比较

       中国大陆和香港地区WISC-Ⅳ(2006)和WISC-Ⅱ(1982)两次测验的描述统计见表1。t检验分析结果表明,中国在2006年和1982年两次测验的IQ总分(FIQ)之间有显著差异:t=10.22,df=109,p<.001,

=.55。

       按照弗林效应,长时间使用同一版本的智力测验后,其分值会按0.3/年的速率增加。例如,1982年发布的W2(常模平均数为100分)在24年后使用,得到的FIQ值减去W4的FIQ值(常模平均数重新修订为100分),再除以24(年),即为弗林效应的年增益量,即弗林效应的计算公式是:两次测验的FIQ值之差/两次测验的年限之差。

       WISC-Ⅳ与WISC-Ⅱ的发布时隔24年,中国大陆和中国香港在24年间的IQ总分相差10.66(见表1),这表明出现弗林效应,且平均年智商增益量为0.44,高于弗林效应年增益量0.3的一般规律,是它的1.5倍。

       2.2.2 中国台湾地区WISC-Ⅳ和WISC-Ⅲ的IQ总分增益量比较

       中国台湾地区的WISC-Ⅳ(2003)和WISC-Ⅲ(1991)的平均IQ总分的描述统计(见表2)和t检验结果表明,两次测验IQ总分之间差异不显著,t=.76,df=59,p>.05,且增益量仅为0.08/年,几乎停止增长,未出现弗林效应。

       而在同一时期,美国儿童(平均年龄11.39岁,n=244)的WISC-Ⅳ和WISC-Ⅱ的IQ总差异量为2.91,平均年增益量为0.24(美国培生测验公司提供),略低于20世纪美国46年间的IQ增长规律0.3(Flynn,1984)

       综上所述,与以往研究结果一致,在中国不同地区,或与美国不同的国家,儿童的智力测验总分增长趋势不尽相同。究其原因,本文在研究2中选择中国经济和教育发展不同地区的W4数据,从社会因素方面做了进一步的探究和分析。

      

       3 研究2

       研究2的目的:为了进一步说明社会因素对儿童智力发展的影响,本研究通过选择W4同一批测量数据,分析和比较中国大陆不同地区儿童智力水平的差异,并探究其形成差异的原因。

       3.1 研究方法

       3.1.1 样本来源和测量方法

       研究2的样本来源为在中国大陆进行WISC-Ⅳ(2006)中文版常模修订的数据,取样包括中国大陆四大地区:北部地区包括华北和东北地区8省市、东部地区包括华东地区7省市、西部地区包括西南和西北地区10省市、中南地区包括华中和华南地区6省市。抽样方法采用按人口比例随机整群抽取。分半信度的计算结果,常模样本各合成分数的平均信度系数在0.87与0.97之间,均达到WISC-Ⅳ美国原版的标准。总智商分的再测信度为0.91,四个合成分数的再测信度均介于0.800与0.880之间。采用相关分析方法,计算WISC-Ⅳ与WISC-R总智商分的效度,r=.71,p<.001,证明了修订后的WISC-Ⅳ(中国版)的有效性(张厚粲,2009)。

       3.1.2 样本分布

       中国大陆四大地区的样本共1338名儿童,其中北部地区284人、东部地区386人、西部地区300人、中南地区368人,包括685名男童和653名女童,他们的平均年龄为11.09岁。

       3.2 统计分析结果

       3.2.1 中国大陆不同地区的儿童WISC-Ⅳ成绩比较

       中国大陆四大地区WISC-Ⅳ智商总分和各分项指数表成绩的描述统计见表3。

      

       四大地区的智商总分(FIQ)方差分析结果差异显著,F(3,1325)=9.10,p<.001,

=.020;采用Sidak方法事后检验结果:北部地区(101.64)显著高于西部地区(97.71),MD=3.93,p<.05;东部地区(102.10)显著高于西部地区(97.71)和中南地区(98.32),MD=4.38,p<.01;MD=3.67,p<.05。

       不同地区四个IQ分项指数的结果表明:言语理解指数VCI和工作记忆指数WMI均有显著差异,F(3,1325)=10.48,p<.001,

=.02;F(3,1325)=9.28,p<.001,

=.02;知觉推理指数PRI和加工速度指数PSI则差异不显著。

       事后检验结果:(1)言语理解指数VCI:北部地区(101.62)显著高于西部地区(97.31)和中南地区(98.18),MD=4.31,p<.01,MD=3.44,p<.05;东部地区(101.76)显著高于西部地区和中南地区,MD=4.45,p<.01,MD=3.58,p<.05。(2)工作记忆指数WMI:北部地区(101.81)显著高于西部地区(97.98)和中南地区(96.93),MD=3.83,p<.05,MD=4.94,p<.01;东部地区(100.96)显著高于中南地区,MD=4.03,p<.01。而北部地区与东部地区之间在VCI和WMI上均无显著差异。

       上述统计结果表明,不同地区儿童智力发展水平的差异主要体现在言语理解VCI和工作记忆WMI得分上,而在PRI和PSI指数上则未显示出地区差异。

       3.2.2 中国大陆四大地区不同父母教育水平的儿童WISC-Ⅳ成绩比较

       图1表示在中国四大地区不同父母教育水平下,儿童在WISC-Ⅳ总分及各分项指数成绩的变化趋势。

      

       图1 中国大陆四大地区不同父母教育水平的儿童IQ平均成绩

      

       事后检验结果表明:(1)总智商分FIQ:大专以上学历(107.33±20.06,n=365)显著高于小学和初中学历(94.19±17.09,n=540)及高中或职高学历(101.04±15.98,n=433),MD=6.31,p<.001,MD=13.14,p<.001;高中或职高学历显著高于小学和初中学历,MD=6.83,p<.001。

       (2)言语理解VCI项:大专以上学历(106.25±18.43)显著高于小学和初中学历(94.57±16.29)及高中或职高学历(100.63±15.39),MD=11.69,p<.001,MD=5.65,p<.001;高中或职高学历显著高于小学和初中学历,MD=6.06,p<.001。

       (3)知觉推理PRI项:大专以上学历(105.35±19.10)显著高于小学和初中学历(95.37±16.69)及高中或职高学历(100.63±16.19),MD=9.97,p<.001,MD=4.67,p<.001;高中或职高学历显著高于小学和初中学历,MD=5.30,p<.001。

       (4)工作记忆WMI项:大专以上学历(104.45±18.61)显著高于小学和初中学历(95.46±16.07)及高中或职高学历(99.91±15.84),MD=8.99,p<.001,MD=4.54,p<.001;高中或职高学历显著高于小学和初中学历,MD=4.45,p<.001。

       (5)加工速度PSI项:大专以上学历(104.30±19.55)显著高于小学和初中学历(95.22±17.04)及高中或职高学历(101.06±15.27),MD=9.08,p<.001,MD=3.24,p<.05;高中或职高学历显著高于小学和初中学历,MD=5.84,p<.001。

       上述结果表明,无论是哪个地区,父母教育水平对子女智力水平均有显著差异。

       3.2.3 中国大陆不同地区及父母教育水平对儿童IQ成绩的影响

      

      

       回归分析结果(见表4)表明,东部、北部与西部、中南不同地区对儿童的总智商分FIQ有显著影响,且小学和初中、高中或职高及大专以上三种不同学历对儿童的FIQ也有显著影响。不同地区(东部、北部与西部、中南地区)与不同学历(小学和初中与高中或职高及大专以上)有交互作用。

       4 讨论

       4.1 中国大陆不同地区儿童智力测验IQ增益量比较

       研究1结果表明,韦氏儿童智力测验的确存在弗林效应,但不同地区儿童智商增益量不尽相同,中国大陆和中国香港地区的IQ增益速度要远高于中国台湾地区,达到0.44/年,而中国台湾地区仅为0.08/年,且低于0.3/年的弗林效应标准。中国大陆、中国香港和中国台湾地区同为一个民族,地缘相邻,其儿童智商水平的发展速度却大相径庭,其原因可能是多方面和复杂的。根据以往研究从社会因素和生物学因素来解释弗林效应产生的原因(Neisser,1998),从社会因素分析:自20世纪中叶,中国大陆、中国香港和中国台湾地区可以说是各自按照不同的社会环境进行发展,在20世纪70年代末以后,中国大陆开始实行改革开放,至今30多年,其社会经济和文化教育,都发生了巨大变化,全国的GDP从1982年的5323.4亿元到2006年的211923.5亿元,提高了38.8倍(数据来源:中国国家统计局,2008)。经济的快速增长,带动了其他领域的发展,特别是教育方面的发展,使更多的儿童受到良好的教育。中国大陆地区在1980年只有675所大学,到2006年已拥有1867所大学,增长了2.8倍,毕业的大学生人数从1980年的114.4万人到2006年的1738.8万人,增长了15.2倍。经济的繁荣还提高了人们的生活水平,使更多儿童能够接受更好的营养和医疗保健;再者,随着社会的发展、科学的进步、儿童在更复杂的社会中接受的信息无限增多等,诸多因素都促使儿童的认知能力得到提高。正是这种快速变化的时代,为促进儿童智力水平快速发展提供了良好的时机。而中国台湾地区在30多年来社会各方面一直平稳发展,这一点与北欧的挪威和丹麦等国情况相似(Sundet,Barlaug & Torjussen,2004;Teasdale & Owen,2005,2008)。与这些国家一样,自20世纪90年代中期以后,中国台湾地区儿童的年平均IQ增益量也基本没有增长。通过分析中国不同地区社会变化的明显区别,我们可以证明社会经济发展是影响儿童智力水平的一个重要因素。

       4.2 中国大陆不同地区和父母教育程度对儿童智力发展的影响

       研究2考察了中国大陆不同地区和父母教育程度对儿童智力发展的影响。通过方差分析和回归分析,我们得出以下两个结果。

       一是,东部和北部地区的儿童总智商分要显著高于西部地区,且东部地区显著高于中南地区,其中,东部和北部地区具体还表现在言语理解VCI和工作记忆WMI的得分,要显著高于西部或中南地区,而在知觉推理PRI和加工速度PSI上,四个地区并无显著差异。这种东部和北部地区儿童IQ高于西部和中南地区的现象,显然与不同地区社会经济的发展不平衡有关。由于中国幅员辽阔,各地区经济和教育发展水平相差较大,根据中国区域经济发展报告(2008-2009),以2007年为例,我们将其地区生产总值、经济效益、三大需求三组相关指标转换为可比较的指数来看区域经济发展格局:东部(55.28%)和北部地区(8.48%)的生产总值占全国的63.76%,中部地区的生产总值占全国的23.07%,而西部地区的生产总值仅占全国的13.17%(李婷婷,2010)。东部地区的经济发展水平比西部地区有明显优势。

       东部和北部地区快速的发展同样带动了教育的发展,加速了社会互动,提供了更多信息交流,为儿童智力发展创造了良好条件;相比而言,西部地区经济发展相对滞后,直接制约着教育的发展,这或许是造成西部和中南地区的儿童智商水平较低的原因之一。这一结果与研究1的结果相一致,也再次证明区域性社会经济发展之间的不平衡,导致了儿童智力发展上的不同结果。

       二是,父母的教育程度对儿童智力发展有着极强的影响。无论在中国哪个地区,儿童的IQ分数似乎是父母教育程度的函数,父母的教育水平与其子女的智力测验成绩成正比。从传统观念上说,中国的家庭普遍注重教育,每个父母都有“望子成龙”的愿望,尤其是自20世纪70年代以来,中国大陆推行独生子女政策,父母对子女的教育更加重视,通常一个家庭会将全部精力和资源投入给独生子女,这更使得家庭小环境以及父母自身的素质对子女的智力发展产生重要的作用。

       综上所述,尽管目前对弗林效应产生原因的认识是多方面的,而且不尽相同,但有一点是毋庸置疑的,只要社会和教育环境在发展、在变化,人类的进化在继续,那么,人类的智力水平就会逐渐提高。然而,由于各国和各地区的环境变化不同,儿童智力水平提高的程度也不同,因此,为了保证当前智力测量的准确性,遵循智力发展的自然规律,智力测验的常模需要定期修订是非常必要的。

       5 结论

       (1)中国大陆和中国香港的韦氏儿童智力测验存在弗林效应,中国大陆和中国香港儿童的智商增益量较大,而中国台湾地区基本不变。

       (2)中国大陆不同地区儿童的智力发展水平不一致,北部和东部地区儿童的智商水平显著地高于西部和中南地区,其原因是社会经济和教育发展水平在儿童智力发展中起着重要的作用。

标签:;  ;  

中国儿童智力测验的弗林效应及其影响因素_韦氏智力测验论文
下载Doc文档

猜你喜欢