数学成就的性别差异,本文主要内容关键词为:差异论文,性别论文,成就论文,数学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 G44;B848
数学对个人的学术成就、职业选择等都有着深远的影响,被认为是个人声望和收入的“过滤器”(Ceci,Williams,& Barnett,2009; Halpern,Wai,& Saw,2005)。男性和女性在数学成就上的差异被认为直接影响了职业选择和生涯成就的性别差异,因此数学成就的性别差异长期以来是众多研究者关注的焦点(如Ceci & Williams,2010; Halpern et al.,2007; Olszewski-Kubilius & Lee,2011)。同时,对该问题的探讨也是广受社会关注的重要问题。哈佛大学前任校长Summers(2005)因发表“女性在数学和自然科学领域先天逊于男性”的言论而被迫辞职,数学成就性别差异问题的社会影响力可见一斑。长期以来,人们持有“男性的数学成就比女性更高”的刻板印象。近年来随着对数学成就的性别差异研究的深入,特别是元分析等方法的运用,研究者对性别和数学成就的关系有了新的认识,提出了新的理论假设,对数学成就的性别差异产生的原因认识更加深入。本文拟概括分析近年来有关该领域研究的新进展,并进一步分析未来值得探讨的问题。
1 数学成就性别差异研究中的两个新假设
关于数学成就的性别差异问题,传统上人们关注男性和女性在平均水平上的差异,研究者也更倾向于得出均值差异显著的结果。近年来该领域提出了两个重要假设:“男性更大变异假设”和“性别相似性假设”,大大拓展了以往的研究思路,使人们对数学成就和性别的关系有了进一步的认识。
1.1 男性更大变异假设
对于智力上的性别差异,100多年前Ellis就提出了“男性更大变异假设”(Greater Male Variability Hypothesis),以解释当时天才和智力迟滞人群中都是男性占多数的现象(Hyde & Mertz,2009)。检验该假设常用的统计量是方差比(Variance Ratio,VR)。以男性方差比女性方差,若VR>1.0说明男性方差更大,VR<1.0说明女性方差更大,也有人认为VR达到1.10时才有实际意义(Feingold,1992)。
虽然智力的“男性更大变异性假设”已有百年历史,但在数学成就的研究上近年来才得到关注。特别是国际上大尺度成就测量的兴起,为在广泛且具代表性的人群中检验此假设提供了可能。Hedges和Nowell(1995)考察1960~1992年间美国6个全国代表性调查的数据显示,数学测验得分的VR都在1.05~1.25之间。近期对美国700万2~11年级儿童青少年的数学成绩分析表明VR在1.11~1.21之间(Hyde,Lindberg,Linn,Ellis,& Williams,2008)。国际性学生成就调查中亦显示出男性有更大变异,如在参与2003年国际学生评估项目(Programme for International Student Assessment,PISA)的41个国家和地区中有37个数学成绩VR显著大于1(Machin & Pekkarinen,2008)。
虽然男性的方差并没有比女性的方差大许多,但轻微的方差差别就会在分布的尾端造成巨大的差异。比如在得分分布最高端的5%人群中,男性人数是女性的1.7~2.3倍(Hedges & Nowell,1995; Hyde et al.,2008; Machin & Pekkarinen,2008),这个比例在数学早慧儿童中甚至更大(Benbow & Stanley,1980,1983; Wai,Cacchio,Putallaz,& Makel,2010)。但是在得分分布的低端是否也是男生占多数,研究者并没有得出一致的结论(Lohman & Lakin,2009; Penner & Parer,2008; Pope & Sydnor,2010; Strand,Deary,& Smith,2006)。
“男性更大变异假设”为全面认识数学成就的性别差异提供了新的角度。然而,这一假设只是对数据的描述,而非对数据的解释。至于为什么男性的变异比女性更大,研究者还没有得出令人信服的结论(Halpern et al.,2007)。
1.2 性别相似性假设
在数学成就上,提到性别时公众很容易想到两性之间的差异。但近年来大型调查和元分析发现男性和女性的数学差异并没有传统认为的那么大,两性间的相似性远比差异要多得多。Hyde(2005)提出了“性别相似性假设”(Gender Similarities Hypothesis),认为男性和女性在大部分心理变量上是相似的。
从上世纪80年代以来,元分析的广泛应用为研究数学成就的性别差异问题提供了新的证据。元分析是将某领域以往研究结果进行定量整合的统计分析方法,其常用的统计量之一是效应值(Effect Size) d (Cohen,1992),公式为d=(X[,M]-X[,F])/S[,W],其中X[,M]表示男性均值,X[,F]表示女性均值,S[,W]为联合标准差。在统计上,效应值d反映的是两个分布均值间以标准差为单位的差异大小,表示两个群体实际差异的大小。根据经验标准,效应值0.2为小效应,0.5为中等效应,0.8为大效应。Hyde(2005)将小于0.1的效应值设为接近于0。本文中的d正值代表男性得分较高,负值代表女性得分较高。
较早一项对100项研究中254个效应值的元分析发现,总体人群中性别差异的效应值d只有-0.05(Hyde,Fenneman,& Lamon,1990)。之后对1990~2007年间相关研究的元分析显示数学成就的性别差异效应值只有0.05(Lindberg,Hyde,Petersen,& Linn,2010)。国际总体趋势亦是如此。2003年的PISA和2003年的国际数学与科学教育成就趋势调查(Trends in International Mathematics and Science Study,TIMSS)的数学测验数据中性别差异平均效应值都在0.15以下(Else-Quest,Hyde,& Linn,2010),研究者们普遍认为这样小的差异并不具有实际意义。
可见,大型调查及元分析的结果验证了Hyde(2005)提出的“性别相似性假设”(Gender Similarities Hypothesis)。“性别相似性假设”的重要意义在于平衡当前普遍存在的有关性别的刻板印象,提醒人们在强调性别差异的同时,也要关注男性和女性的共性。Hyde(2007)指出“科学地讲,我认为性别相似性和差异性同样有趣,未来的研究者,无论是性别研究者还是在关注其他问题的同时做了性别差异测试的研究人员,其结果无论是存在性别差异还是性别相似都应该报告,使我们对两种观点有对等的认识。”(p.260)。
“男性更大变异假设”和“性别相似性假设”不仅为相关研究开辟了新的方向,而且将极大推动、拓展、更新人们对于数学成就与性别关系的认识。目前,我国有关数学成就、乃至整个性别心理的研究还主要以描述男女心理特点的组间平均数差异为主,几乎没有对组内变异和组间相似性的考察和分析,不利于客观、全面、深入地理解性别特点。因此,有关性别特点的进一步研究应重视考察男女两性的组内变异和组间相似性,在“男性更大变异假设”和“性别相似性假设”下开展系统的工作。
2 数学成就性别差异的特异性
虽然近年来的多项研究提示总体均值上数学成就的性别差异并不显著,但数学作为一个复杂的知识体系,包括算术、代数、几何等许多领域(张华,庞丽娟,陶沙,陈瑶,董奇,2003),其认知加工过程涉及数字加工、计算、问题解决等(Hyde et al.,1990),这使得数学成就的性别差异具有极大的复杂性。综合分析有关数学成就性别差异的研究,我们可以清晰地看到,数学成就性别差异的大小和方向受到评分系统、测验组织形式、测验内容和难度的影响。
2.1 日常考核和高利害测验的分离
虽然传统上人们多认同“数学是男性学科”,然而近十多年的研究显示,从小学到大学在日常考核中女孩得到的评分等级(Grades)往往比男孩高;不过在高利害的考试,如北美SAT(Scholastic Assessment Test)或GRE(Graduate Record Examination)等标准化测验中男性的数学成绩却比女性高(Halpern et al.,2005; Wiest,2011)。在中国的发达地区也是如此。Lai(2010)追踪北京东城区7,000多名初中生发现在期末考试中都是女孩的成绩要优于男孩,在中考中男孩的成绩却稍好于女孩,但这种升学考试的性别差异没有北美学生表现得那么明显。评分等级的性别差异还有逐步扩大的趋势。如在1990年男孩的数学和科学的平均评分等级(Grade Point Averages,GPA,最大为4.0)比女孩低0.12,而2005年时差异扩大到了0.20(Wiest,2011)。但标准化测验的性别差异在过去30年间几乎没有变化,如男生的SAT-M(Mathematics section of SAT)得分稳定高出女生40分,平均效应值达到了0.39(Halpern et al.,2007)。
可见,男生和女生数学成就的差异在日常考核和高利害的标准化测验中出现了分离。这可能与两种评分系统各自的特点有关。和标准化测试相比,评分等级不仅评价数学能力,还受到作业完成情况、出勤率等因素的影响,而女孩在自律方面比男孩更强(Duckworth & Seligman,2006),并且在熟悉的、基于课堂学习的数学内容上比男孩表现更好,这些可能是女孩在评分等级上比男孩获得更高评分的原因(Halpern et al.,2005)。SAT-M等标准化测试有两个突出特点:考题不基于课程、具有高利害性,这可能是导致男性在标准化测验中存在优势的原因(Gallagher & Kaufman,2005)。研究者发现在新奇内容的数学测验上男孩比女孩有更好的表现(Lohman & Lakin,2009);男性在有风险高回报的任务上和高竞争环境中也比女性表现出更高的兴奋性(Niederle & Vesterlund,2010)。
另外,和中国的高考一样,SAT-M等标准化测验并不具有总体人群的良好代表性。美国男孩的中学辍学率要高于女孩,而辍学的往往是成绩较差的学生,参加此类测验的男生平均水平因而较高,这也可能是在标准化测验中男孩成绩较好的另一原因(Hyde et al.,2008)。和SAT一样,ACT(American College Test)也是大学入学考试学生自愿选择的考试。2002年以后美国两个州让全体高中学生参加ACT后男生得分的优势消失了,甚至女生平均成绩还稍高于男生(Hyde et al.,2008)。相似的,在Lai(2010)北京东城区的研究中也发现男孩的辍学率要高于女孩。
日常考核和标准化测验中男生和女生数学成就差异的分离提示SAT-M等高利害的标准化测验对女孩不利(Spelke,2005),而日常的评分等级则可能低估了男孩的数学能力。为此,研究者提出控制评分等级来考察标准化测验的性别差异,或者控制标准化测验的成绩考察评分等级的性别差异(Ceci et al.,2009)。然而,对于数学这种复杂的知识和能力系统很难有完美的测评方法。不同的测验和评分系统是从不同的方面考察数学成就,很难界定哪种测评更优越、哪种测评更有偏差。事实上,对不同测验和评分系统与数学成就性别差异关系的研究表明,数学成就性别差异的表现受到测验本身特点的影响。因此,整合来自不同测验体系研究的结果不仅有助于全面、准确地认识数学成就的性别差异,而且也在一定程度上揭示出性别差异的可能来源,并提示人们在评价和理解数学成就的性别差异上采用综合的而非单一的视角。
2.2 测验组织形式的差异
测验的组织形式也可影响到数学成就的性别差异。影响性别差异的测验情景多种多样,如指导语、测验人数、主试和被试的互动等等。在集体施测时的性别差异要比个体施测小(Ceci et al.,2009)。相对于个体施测,在集体施测中单个被试并不是主试唯一关注的目标,是一个相对的去个性化情景,会降低性别差异(Hyde,2005)。而个体施测时主试是女性比主试是男性时获得的性别差异小,女性主试能够为女性被试提供榜样力量,在一定程度上消除性别刻板印象威胁,有利于女性被试的发挥(Marx & Roman,2002)。
测验的时限对性别差异也有重要影响。相比没有时间压力的测验,在那些有时间压力的测验中,男孩的优势更大,这可能是由于女孩回答问题速度更慢、更为谨慎所造成的(Gallagher & Kaufman,2005)。Royer和Garofoli(2005)还认为对数学事实的回溯速度也影响男女数学成绩,男孩对数学事实的回溯速度快于女孩,从而导致在有时间压力的数学测验上存在性别差异。
更有意思的是,在测验形式为选择题时男孩的成绩较好,而测验是开放题时女孩的成绩好于男孩(Lindberg et al.,2010),这可能是由于在解决数学问题时女生更喜欢使用具体的策略,而男生更多使用抽象复杂的解决策略;在策略选择方面男生也更为灵活,女生在做选择题和开放题时都是使用运算的方法,而男生在做开放题时使用运算法,但在做选择题时较少使用这种方法(Gallagher et al.,2000)。
测验的组织形式对性别差异的影响为数学成就的性别差异研究开拓了新视角。测验情景能够塑造、消除甚至逆反数学成就的性别差异。但这种差异往往很容易被忽略,特别是在标准化的测验情境中可能会造成系统误差,比如只用男性主试或只用女性主试。因此,应充分重视测验情景因素的效应,为数学成就测验提供更具性别公平的情景。
2.3 测验内容的差异
如前提到的,数学本身是复杂的知识体系,数学的不同领域构成了数学成就的不同方面。研究表明,数学成就测验不同内容上性别差异也不同。例如,视空能力是影响数学成就一个重要的认知因素,特别是对心算、数学应用题等依赖心理表征的数学任务尤其重要(Halpern & LaMay,2000;刘昌,王翠艳,2008),而恰恰在这些任务中男孩比女孩有更好的表现。比如,Quinn和Spencer(2001)抽取研究生管理专业入学考试(Graduate Management Admissions Test)中的一些应用题考察性别差异,发现大学男生得分比女生得分更高,但将这些应用题转为代数题时性别差异消失了。在涉及视空能力的数学任务中性别差异出现的年龄也早,心算任务上在6~7岁就已经出现了性别差异,但是基本的数学认知技能此时并没有差异(Chen,Chen,Chang,Lee,& Chen,2010; Rosselli,Ardila,Matute,& Inozemtseva,2009)。
在不同难度的数学任务上性别差异表现也并不一致,简单的数学任务并不存在差异或者女生比男生更好,而在较难的任务上男生表现较好(宋广文,陈霞,2010)。Hyde等(1990)将测验分为三个认知难度,最简单的为计算,其次为测量,最难的为复杂问题解决。他们发现在计算和测量任务上小学和初中女孩稍优于男生,但在复杂问题解决任务上男孩在高中阶段明显高于女孩,效应值d为0.29。即使在数学能力较高的被试中,性别差异的大小也会受到任务难度的影响(Spencer,Steele,& Quinn,1999)。
性别差异的大小和方向依赖于测验体系、情景和内容而变化的事实,极大反驳了性别差异巨大且稳定的传统观点。数学测验的内容组成、加工过程、评分系统和测验组织方式等因素的调节作用使得数学成就的性别差异具有较高的情景和内容特异性,很难简单地认定男性或女性谁数学更优或更差。这些研究进展推动着研究从关注数学成就在性别间的表面差异走向关注与数学成就性别差异有关的内外部影响因素。
3 数学成就性别差异形成的可能因素
数学成就的性别差异多样性说明其来源也是多方面的,Halpern和LaMay(2000)提出用生物心理社会模型(Biopsychosocial Model,有时也称Psychobiosocial Model)解释在认知变量上的性别差异,强调多方面因素的综合作用。
3.1 年龄
研究表明,在婴儿到幼儿时期,男孩和女孩的数学能力倾向并不存在差异。即使在三年级女孩就开始认为自己的数学能力要差于男孩(Spelke,2005),但小学和初中时期男生和女生的数学成就并不存在差异,甚至在初中之前女孩的数学成绩还优于男生(Hyde et al.,1990)。在初中后期或高中阶段,数学成就的性别差异开始出现(Hyde et al.,1990; Lindberg et al.,2010; Wiest,2011),男孩逐渐超越女孩。跨文化的研究也验证了这一现象,对中日美三国儿童的数学差异进行研究,Stevenson及其同事发现在小学阶段三个国家男女生的数学成绩都没有差异,而到11年级男生的数学成绩才高于女生(Stevenson,Chen,& Lee,1993; Stevenson,Lee,& Stigler,1986)。
关于高中以后数学成就的性别差异是否比高中阶段更大,研究者并没有达成一致。Hyde等(1990)发现在大学阶段和大学毕业后数学成就的性别差异比高中阶段更大。但Lindberg等(2010)的元分析结论正好相反,在高中以后差异逐渐减小。也有研究表明从小学到高中性别差异都不存在,Hyde等(2008)对美国各州的数学评估成绩分析发现在2~11年级之间都不存在性别差异,各年级的性别差异效应值都在0.06以下。
虽然性别差异随年龄的变化是人们较为关注的内容,但年龄因素涉及到认知发展和学习内容的变化,并不是一个单纯的变量,甚至数学认知能力的结构在不同的年龄上也并不完全一致(张华等,2003),导致各个年龄段的可比性遭到质疑,这也是该领域广泛使用的横断研究难以解决的问题。如果要回答数学成就性别差异的年龄变化问题,需要跨度较大的追踪研究提供答案。
3.2 遗传和进化
Strauss和Strauss(2009)认为哺乳动物的性别决定机制和X染色体失活现象,导致那些受到位于X染色体上基因影响的特质中,男性的变异比女性更大。如果数学成就只由基因决定的话,依赖于数学相关基因中位于X染色体上相关基因所占的比例,男女方差比应该介于1和2之间。显然,数学成就并不是完全由基因决定,但是男女方差比依然是在1和2之间(Hedges & Nowell,1995; Hyde et al.,2008; Machin & Pekkarinen,2008),说明男性更大变异有可能受到基因的影响。
一些研究者用进化的观点来解释数学成就的性别差异(Geary,2007),认为虽然数学成就的性别差异并不会直接进化而来,但是进化可以导致男性和女性的兴趣、大脑结构和认知系统的差异,比如狩猎和战争需要制造和使用投掷武器,也需要男性在更广阔的范围内活动,导致男性的空间能力得到了较好的发展。但进化的观点受到了Newcombe(2007)的质疑。第一,女性由于需要在大范围区域采摘食物和编织活动,也会发展出较好的空间能力;第二,空间能力的性别差异并不是固定不变的,在经过训练后性别差异可以消除。比如Tzuriel和Egozi(2010)对1年级男孩和女孩经过3个月的“空间感觉”干预后,原来存在的空间能力性别差异消失了,同时他们也发现策略的选择中介了空间能力的性别差异。
3.3 激素和脑
关于生理因素影响数学成就性别差异的研究大致可以分为两类:性激素和脑结构及功能。研究者主要通过考察生理因素对一般智力及其特殊成分的作用来推测其对数学成就的性别差异的影响。由于视空能力对数学成就有重要的影响,有关生理因素对数学能力性别差异的影响研究也大多以视空能力为核心探讨。
性激素对视空能力有重要的影响。患有先天性肾上腺皮质增生症(Congenital Adrenal Hyperplasia,CAH)的病人雄性激素分泌过多,女性患者表现出过多的男性特征(Puts,McDaniel,Jordan,& Breedlove,2008)。元分析发现男性CAH患者的视空能力比正常男性的要低,但是女性患者的视空能力却比正常女性的视空能力更高,由此可推测雄性激素对视空能力促进的最高点应该在男性和女性分泌量的中间,即雄性激素对视空能力的促进作用呈倒U型(Puts et al.,2008)。同样来自于变性人的证据也证实了这一观点,经过3个月的雄性激素注射治疗后,女变男的变性人的视空能力有了显著提高(Slabbekoorn,van Goozen,Megens,Gooren,& Cohen-Kettenis,1999)。
对脑的研究比对激素的研究更为复杂,因为脑的发展过程中每一步都受到了社会经验的影响,很难说明与数学成就的性别差异有关的脑的性别差异到底是先天还是后天形成的。脑容量的大小或许是最粗糙的脑结构的性别差异。Ankney(1992)发现即使在控制掉身高体重等变量后,男性的脑比女性重100g,也许可以解释男性在数学和视空能力上的优势。但这个观点很难让人信服。因为即使脑容量会导致认知能力的差异,但不能解释为什么脑容量只与数学和视空能力有关,而不与那些女性具有优势的领域有关,如言语能力。在解决复杂问题时,男性和女性所涉及的脑区并不一致,男性的IQ和灰质容量最大相关是在额叶和顶叶(BA 8/9/39/40区)上,而在女性身上的最大相关在额叶(BA 10区)和布罗卡区(BA 44/45区)(Haier,Jung,Yeo,Head,& Alkire,2005)。这可能导致在解决复杂问题时男性和女性采用不同解决策略,策略对特定问题的适合性可能是男女在某些数学任务上出现差异的原因。
但男性和女性IQ-灰质容量最大相关脑区的差异并不能断定是先天因素造成,经验对大脑的结构和功能都有重要的影响,Tang等(2006)就发现在不同的语言文化体系中进行简单数学加工激活的脑区有所不同。另外激素对性别差异的解释提供的是一种间接证据,存在较多的推论和假设,而且只是相关研究,很难得出因果联系。
3.4 刻板印象威胁
刻板印象威胁(Stereotype Threat)是个体所经历的一种风险,处于该风险中的个体担心自己会验证所属群体的消极刻板印象(阮小林,张庆林,杜秀敏,崔茜,2009)。在现实生活中,男性在科学和数学界的比例远高于女性,导致人们产生数学和科学是男性学科的刻板印象,而这种刻板印象又会反过来影响女性参与到这些领域的比例,使女性在这些领域里面没有归属感,这样相互影响会更加剧在数学相关领域的从业人员比例和成就的性别差异(Nosek et al.,2009)。研究者发现那些“男性=数学”刻板印象越强的男生其数学成绩也越好,而女生的这种刻板印象越强其数学成绩越差(Kiefer & Sekaquaptewa,2007; Nosek,Banaji,& Greenwald,2002)。但这并不能说明刻板印象和成绩的差异孰因孰果。一项研究用数学成绩较好的男女学生作为被试,当告诉被试该数学测验在以前的测试中发现了性别差异时(刻板印象威胁条件),女生的得分低于男生;若告诉被试以前没有发现性别差异时(无刻板印象威胁条件),测验得分也没有性别差异。但刻板印象威胁的影响只存在于较难的数学题目上,简单的数学题目在两种条件下都没有发现性别差异(Spencer et al.,1999)。
父母和老师的数学刻板印象也是影响女孩对数学情感态度的重要因素。老师往往具有数学是男性学科的刻板印象,他们会高估男生的数学能力,对男生也有较高的期望,对待男生的态度也更积极(Li,1999),在教学中和男生有更多的互动,即使在回答错误时老师更多启发男生得出正确的结论,同样的情况下往往会终止女生回答而让其他同学回答,同时在数学学习中也更多督促男生(Jacobs,Davis-Kean,Bleeker,Eccles,& Malanchuk,2005)。同样父母对子女数学能力的评估也存在显著的性别差异,特别是那些具有较强性别刻板印象的父母,通常认为男孩比女孩有更强的数学能力(许晓晖,庞丽娟,2005),而父母的观念会潜移默化影响孩子对数学的态度和情感。相比对数学成就的影响,父母的数学能力观对孩子的数学态度、专业和职业选择有更大的影响(Jacobs et al.,2005)。
在国家层面亦是如此。在一项很有创意的研究中(Nosek et al.,2009),研究者利用1999年和2003年TIMSS数学和科学的成绩,以及通过内隐联想测验网站收集到的多个国家民众关于性别和科学关联的内隐刻板印象,发现国家内隐的“男性-科学”刻板印象均值能显著预测该国数学和科学的性别差异,这种刻板印象越强烈,男性的数学和科学得分高出女性越多。但这种预测作用只限于内隐的刻板印象,外显的“男性-科学”刻板印象并不能预测国家间的数学和科学得分的性别差异(Nosek et al.,2009)。对不同性别的刻板印象并不是只是有利于男性,Pope和Sydnor(2010)发现在美国性别刻板印象越强烈的州,男孩在数学得分分布高端中占的比例越高,而女孩在阅读得分分布的高端占的比例也越高。
虽然刻板印象威胁受到很多研究者的关注,但很少有研究直接考察在实际高利害考试中刻板印象威胁对数学成就性别差异的影响程度。以往研究认为刻板印象会放大实际差异(阮小林等,2009),但最近研究发现根据刻板印象被试虽然能够准确预测标准化测试中性别差异的方向,但却会低估实际差异的大小(Halpern,Straight,& Stephenson,2011)。这个发现对刻板印象威胁在高利害考试中的实际影响形成了挑战。
3.5 社会性别公平
在影响数学成就性别差异的社会文化环境因素中,社会性别公平是研究者较为关心的因素之一。社会性别公平是指女性在某国家或地区的社会地位,如世界经济论坛提供的性别差距指数(Gender Gap Index,GGI)是通过女性参与经济和政治活动的机会、女性入学率等来反映,数值越大代表男女越平等(Else-Quest et al.,2010; Guiso,Monte,Sapienza,& Zingales,2008)。Guiso等(2008)利用2003年PISA的数学数据和国际性别公平指标考察社会的性别公平对数学成就性别差异的影响,发现性别公平对数学成就的性别差异有显著的反向预测作用,在GGI较高的挪威和瑞典数学成绩的男女差距几乎为0,而在GGI较低的土耳其,男孩比女孩高22.6分。
但Else-Quest等(2010)在2003年TIMSS的数据中没有发现这种现象,GGI并不能预测TIMSS各个国家的数学成就的性别差异。Fryer和Levitt(2010)发现有些参与2003年TIMSS的国家如巴林、约旦等GGI很低,但女生的数学成就远高于男生,这些多为阿拉伯国家,实行单一性别学校教育,另外一些国家如埃及等即使是男女混校,但大部分学校是男女分班式教育。当把这些男女分离教育的国家单独分析时发现在这些国家中GGI同样预测了数学成绩的性别差异;再对参与TIMSS的其他国家单独分析,GGI对数学成就的性别差异的预测作用又出现了。可见即使在性别不平等国家里,数学成就的性别差异也可以由单一性别式教育来消解。当然Fryer等也只是根据少数国家的数据得出相关结论,并且大部分是阿拉伯国家,并不一定具有文化普遍性。比如Kim和Law(2011)就发现和混合学校相比,香港单一性别教育学校中学生数学成就的性别差异反而增大了,虽然这可能与香港女校和男校的课程设置有关,但单一性别教育对数学成就性别差异的作用仍需进一步考证。
3.6 时代
随着社会环境的变化和教育体制的改革,数学成就的性别差异也随着时代逐渐变化。元分析发现在上世纪60年代到90年代之间,数学成就的性别差异逐渐减小,但减小速度逐渐放缓(Friedman,1989; Hyde et al.,1990)。在1990年之后,数学成就的性别差异效应值基本没有变化。研究者认为自1990年以来性别差异没有随时间的变化而减小或许是由于在总体均值上性别差异已经非常小,没有可以显著变化的空间(Lindberg et al.,2010)。
高数学成就者性别差异的变化趋势和总体人群基本一致。在上世纪80年代初期,参加SAT-M的数学早慧儿童中得分在700分以上男女人数之比为13∶1(Benbow & Stanley,1980,1983; Wai et al.,2010),到了80年代末比例就下降到了7∶1,在1991年之后,SAT-M在700分以上的男女人数就稳定在4∶1左右(Wai et al.,2010),2000年之后数学天才儿童的性别差异效应值也稳定在0.3~0.4之间(Olszewski-Kubilius & Lee,2011)。Wai等(2010)在另外一个广泛运用的数学测验ACT-M(Mathematics Sections of the American College Test)上也发现相似的趋势。研究者把性别差异的时代趋势归因于更多女生选择高级数学课程(Hyde et al.,1990)。在1990年之后男生和女生选择高级数学课程的比例已经没有差异(Ceci et al.,2009; Halpern et al.,2007),数学成就的性别差异也就没有发生变化。
由于数学成就性别差异的研究在北美起步早,数学成就的性别差异时代趋势的研究基本来自于北美的数据,特别是美国的研究,但北美的研究结论能否推论到更广泛的社会文化中还存在疑问。另外,时代并不是一个独立的变量,时代的变化伴随着各种社会变革,包括性别文化、教育体制等的变革,到底是哪种社会变革导致了数学成就的性别差异的变化也是值得研究的问题。
4 研究展望
数学成就的性别差异远比通常人们所认为的复杂得多。数学成就的性别差异不仅仅是一个教育学的问题,还涉及到生物学、心理学和社会学等多方面的因素。虽然研究倾向于认为总体数学成就不存在显著的性别差异(Else-Quest et al.,2010; Hyde et al.,1990; Lindberg et al.,2010),但在具体的内容和情境下差异表现并不一致,并且对于数学这种复杂的认知能力,性别差异产生的原因不可能只是单一的因素。数学成就的性别差异研究在近几十年内取得了丰硕的成果,在强调性别公平的大背景下,还将继续成为研究者关注的焦点。未来的研究可以从以下几个方面继续深化有关数学成就和性别关系的探讨。
4.1 开展追踪研究
数学成就的性别差异研究基本上采用横断研究,但横断研究容易产生同辈效应(Chen et al.,2010),难以区分各个年级性别差异的不同到底是由于年龄的影响还是时代的影响。另外横断研究不能得出因果结论,对于数学成就的性别差异的影响因素探讨也只能利用相关来分析。追踪研究则可以克服横断研究的不足,对数学成就的性别差异产生机制和发展轨迹的探讨有重要价值。
4.2 关注低数学能力者的性别差异
研究者对数学成就的性别差异的研究多集中在一般人群和高数学能力人群中,但对于低数学能力人群的研究还很少,得出的结论也相互矛盾。有些研究者认为男孩对环境更敏感,更容易受到不良环境的影响(Halpern et al.,2007),导致在数学得分分布的低端男生占多数(Lohman & Lakin,2009; Strand et al.,2006);而另外一些研究并没有发现在得分分布低端男生比女生多(Penner & Paret,2008; Pope & Sydnor,2010),即使在家庭经济情况较差的非裔美国小学生中男孩的数学成就也没有比女孩差(McMillian,Frierson,& Campbell,2011)。将来的研究可以继续探讨在低数学成就者中是否是男性仍然占多数?得分分布低端的男女比例是否随着年龄的变化而发生改变?不良的家庭和社会环境是否对男性数学成就的影响更大?
4.3 复杂数学认知神经机制的性别差异
在当今脑成像研究受到重视的时代,人们已经发现在加工数学问题时男女激活脑区不同(Haier et al.,2005; Keller & Menon,2009)。如Keller和Menon(2009)发现在加工加减运算时涉及视空信息加工的背侧和腹侧通路上男性激活程度更高,而女性在这些区域有更高的灰质密度和局部脑容量。
不过,已有的神经机制研究所用的材料大多是简单数学题目(Halpern et al.,2007),在简单数学任务上得出的神经机制并不能直接推广到复杂的任务上,而当前复杂数学认知加工过程中脑激活的性别差异研究还不充分。将来的研究应该探讨在复杂的数学任务上脑激活区域是否存在性别差异,男女相同的表现是否会激活不同的脑区,而不同的表现是否激活相同的脑区?
4.4 建立产生数学成就性别差异或相似性机制的综合模型
认知变量的性别差异先天论和后天论的争论由来已久,大脑可塑性的研究对解决这个争论有着至关重要的作用。Halpern和LaMay(2000)提出了生物心理社会模型,强调认知变量的性别差异是多方面因素相互作用的结果。该模型说明了基因、激素和经验是怎样影响大脑发展的,以及个体怎样依据自己的倾向和过去的经验来从环境里面选择经历,这反过来又影响大脑的结构和联结。该模型如同一个连续的圆环,试图说明各个变量如何相互影响。
本文也从多个角度阐述了数学成就的性别差异产生的原因,但关于各个因素是怎样相互影响,在整个作用模型中每个因素在多大程度上影响了数学成就的性别差异等问题,目前缺少深入的探讨。参考Halpern和LaMay(2000)提出的生物心理社会模型,建立数学成就的性别差异或相似性产生机制的综合模型,深入探讨生理、心理、宏观和微观环境变量各自和综合的影响,是将来研究的重要方向。
4.5 在更广阔的社会环境下开展研究
社会文化对数学成就的性别差异有重要的影响,特别是社会中的性别公平(Else-Quest et al.,2010; Guiso et al.,2008)。目前数学成就性别差异的研究多集中在欧美国家,在像我国这样的发展中国家的研究还很少,特别是缺乏具有良好全国和地区代表性的研究,因此难以回答数学成就的性别差异的文化普遍性和特异性问题,也无法为广大发展中国家和世界有关个体发展的性别公平问题和相关政策制定提供依据。
尤其我国,在传统文化中具有明显的性别不平等而在当下文化中又具有强烈性别平等取向(杨菊华,2010),再加上独生子女政策的影响,这些使得在我国开展有关的研究别具重要意义。例如,在我国一直强调性别平等,新中国成立以来中国女性的社会地位有了显著的提高,世界经济论坛报告的性别公平指数中国的排名也在逐年提升,但中国的性别公平排名迄今只是在中游水平,比如2009年和2010年中国在134个国家中GGI排名都是第61位(Hausmann,Tyson & Zahidi,2010)。另外受计划生育政策的影响,中国传统的男尊女卑思想受到了很大的冲击,在教育投入方面,特别是城市家长对女孩的投入甚至比男孩还高(Tsui,2007)。因此,对我国儿童青少年数学成就性别差异的系统探讨值得关注。
近年来,我国心理学工作者共同努力,刚刚完成了中国儿童青少年心理发育特征的全国代表性调查,建成了可公益共享的数据库,这为我国研究者基于全国代表性样本系统探讨中国儿童青少年数学认知和成就的性别差异提供了宝贵的数据资源。
收稿日期:2011-04-13