考试评价制度改革的复杂性分析:以综合素质评价政策为例,本文主要内容关键词为:评价论文,复杂性论文,为例论文,制度改革论文,综合素质论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
考试评价制度改革是教育改革系统中最为核心与敏感的部分。所谓核心,那是因为它牵一发而动全身,考试评价制度的变革会牵动包括课程、教学、管理等各个教育要素的重组和变动。所谓敏感,那是因为它承载了太多的社会功能,考试评价制度的变革会触动包括国家这个主体在内的各方利益和价值观。考试评价制度改革对决策者来说是一个两难问题。一方面,他们非常希望借助它的核心地位来引领教育变革;另一方面,他们又经常因为它的高度敏感而有所顾忌,尽可能回避这个问题。可以说,决策者推动考试评价制度改革的力度,在很大程度上是依赖于他们是更多地看重考试评价改革,对教育改革的核心引领作用,还是更在意考试评价制度改革的社会敏感性。
但在最近一段时间,天平似乎开始往前者倾斜,国家推进考试评价制度改革的决心开始增大。教育部副部长陈小娅明确指出,下一步要充分发挥考试评价制度改革的引领和导向作用,深化考试评价制度改革。各种高度敏感的改革举措也相继出台,实施综合素质评价政策是其中一个重要的内容,引起了各方的高度关注。自媒体报导2009年山东临沂师范学院投档考生中有十几名考生因“综合素质评价低”而被退档之后,《人民日报》、中央电视台、新华网、《中国教育报》以及各地党报等权威主流媒体,都刊发了大量有关综合素质评价政策的分析和争论文章。
但冰冻三尺,非一日之寒,更非一日之暖所能消融。现有的考试评价制度长期遭人诟病,经历过各种各样的改革动议和举措,但却一直未有太多的改变。这说明改革并非仅凭热情与愿望就能取得成功,现有的考试评价制度具备许多并不为人所知的抵制变革的强大能力。格雷斯(G.Grace)说过,“当前教育中的许多问题和危机都只是特定教育政策在深层历史结构上的和意识形态上所存在的矛盾的外在表现而已”。[1]这就提示我们要以一种更加复杂的思维来理解考试评价制度改革,需要认真考察、分析和辩论改革所必然涉及的一些深层次矛盾问题。否则,改革只能是原地打转,不断地重复着过去的错误。但就已有相关的综合素质评价政策的分析讨论文章来看,我们对改革的复杂性认识还不够,对许多问题的理解依然还停留在表面,未能把分析和辩论的重点聚焦到一些重要的深层次问题上。本文就试图对近期综合素质评价政策争论文章所反映出来的一些基本问题进行分析,以期能够提高我们对考试评价制度改革复杂性的理解水平。
一、如何理解改革的公平问题
如果分析近段时间在《人民日报》、新华网、《中国青年报》、中央电视台等有关主流媒体刊发的有关综合素质评价的评论文章,我们就会发现,大量的分析者是从教育公平的角度来质疑综合素质评价政策的。他们的一个基本观点是认为,实施综合素质评价会对农村学生造成不公平。这可以证之于如下这些文章标题之中:“‘综合素质评价’击碎农村学子的梦”、“莫让‘综合素质’影响教育公平”、“谨防‘综合素质评价’异化为歧视”、“综合素质评价是否又成为农村生源的分数杀手”等等。也就是说,担心或者认为综合素质评价会对农村学生造成不利,从而造成教育不公平,是许多人质疑综合素质评价政策的一个基本理由。
大家为什么说综合素质评价会妨碍教育公平呢?通过对上面所提及的诸多论述文章进行分析,我们可以发现,这背后的推理逻辑基本上是这样的:首先,因为综合素质评价不大可能关注诸如勤劳吃苦、孝敬父母等农村学生做得比较好的内容,而更可能关注诸如艺术、体育等有利于城市学生的内容,所以农村地区的学生在综合素质评价中就会吃亏。在这种情况下,如果综合素质评价与高校招生挂钩,那么就会在客观上挤压农村学生升入大学的机会和空间。
我们可以看出他们所理解的教育公平,应该就是指每个学生进入大学的机会不应该受到他们的性别、地域、家庭社会背景等非自身因素的影响。也就是说,他们以学生进入大学学习的机会作为衡量是否公平的一个基本评判指标。应该说,这个理解是清楚的,而且也符合公众的一般认知。
但这里有一个更为基本的问题是,为什么要以进入大学的机会,而不是其他诸如自身综合素质发展等作为衡量是否公平的指标呢?显然,那是因为大部分人都理所当然地认为,对中学生来说,考上大学是他们最重要的事情,是完全凌驾在其他价值之上的终极价值目标。在这里我们看到了整个社会对教育功能的集体想象。
教育功能简单地说就是教育有什么用。在许多人看来,这可能如问“钱有什么用”一样无聊。但事实上,大量的教育政策争论归根结底都要回到这个问题上来,而且它也没有想象中的那么简单,甚至可以说是极其复杂。直到现在,学术界对教育功能的认识仍然是不一致的,不同学者从不同的角度看到了教育的不同作用。其中最为流行的就有两种很不相同的观点。一种是我们在教科书以及政策文件中常见的人力资本理论,即认为教育可以提升受教育者生产力或者素质,后者使得受教育者在人力市场中获得了更高的回报。另外一种是筛选理论,它认为教育的主要作用不是提升素质,而是社会筛选,教育把不同的人贴上不同的标签,如高中生、大学生、高分者、职校生等等,从而供其他机构筛选所需要的人员。
这两种观点没有简单的对错之分,但基于不同的教育功能观就会对教育产生很不相同的理解,就会形成不同的教育公平观。如果把教育看作是一项人力资本投资,那么就会把教育所提供的知识素质看作是我们接受教育的最主要目的,教育公平与否就是指不同的学生是否有相同的机会学习到相应的知识和能力。而如果把教育理解成是一套筛选机制,那么就会把教育看作是一个工具或途径,真正重要的不是教育所提供的知识能力,而是被筛选出来获取诸如名牌大学、优质岗位等“好东西”的机会,教育公平与否就是指不同的学生是否有相同的被筛选机会。
知道了以上这点,那么我们再来分析,在综合素质评价政策的争论中,大家所谈的教育公平是基于什么样的教育功能假定的呢?事实上,我们可以清晰地看到,前面提及的这些评论文章在论述综合素质评价可能造成教育不公平的推理过程中,几乎没有谈到综合素质评价政策可能会让农村孩子得到更少的素质,而让城市孩子得到更多的素质,而是都假定农村和城市学生的能力差异是客观存在的,教育对此是无能为力的,至少是微不足道的,所以综合素质评价可能会使农村孩子被筛选进入大学的机会减少。也就是说,大家都是从社会筛选而不是人力资本投资的角度来理解教育公平和综合素质评价的。另外,综合素质评价政策出台多年未引起人们关注,而一旦当它与高考这个典型的社会筛选机制挂钩起来的时候,大家就开始关注它,这本身也就说明了大家在意的其实不是综合素质评价本身,而是筛选机会的问题。
而政策制定者则可能不是从这个角度来理解教育功能的,因而也不是这样来理解教育公平的。如果对综合素质评价政策文本以及有关官员的政策论证进行分析,①我们大致可以知道,他们之所以推出这项政策,可能是希望通过评价来引导学校、教师和家长更多地关注学生在非学术能力方面的能力素质发展。如果是这样,我们就可以看出,政策制定者其实基于人力资本的角度来理解这项政策的。在他们看来,能否让学生更好地发展综合素质,这比什么都重要,也是最大的教育公平。这与许多家长以及分析者对教育功能的认识是很不同的。
由此我们就可以知道,之所以有教育公平问题的争论,一个很重要的深层次原因在于不同的人是基于对教育功能的不同想象来理解教育公平的。这种教育公平观的不同就造成了人们对综合素质评价政策是否导致教育不公平有着很不相同的认识,并由此产生了前述的种种争论。事实上,这不仅仅是体现在综合素质评价这个政策上,其他任何有关教育公平的政策争论,也同样是面临这个问题。[2]
这也提示我们,除非我们对教育公平进行再概念,重新聚焦问题,否则当前有关教育公平的讨论只是一种简单的情绪宣泄,并不能真正解决问题。正如前面分析所指出的,当前有关教育公平的讨论实际上都是把教育看作是一个筛选学生进入大学的工具,把教育公平看作是“分好东西”的公平。如果这样来理解教育公平,那么任何考试评价制度改革都必然是一场零和游戏,不会真的减少了教育公平,也不会增加了教育公平。因为“好东西”,如北大的入学机会是一个常量,任何改革在提供某些人更多的机会获得这些“好东西”时,就会相应地减少其他人的机会,反之亦然。所以,这样的质疑和讨论其实是没有什么实质意义的,永远不可能真正解决问题。
可见,揭示教育公平争论背后的不同教育功能观以及由此带来的教育公平观,并进行广泛和深入的分析和讨论,这样的政策辩论才会真正是一个社会学习的过程。可惜就目前的情况来看,尽管教育公平越来越成为一个主流的政策议题,但我们对教育公平的理解水平却还没有很大的进展,大多还停留在常识和直觉层面,这对进一步推进我国考试评价制度改革是不利的。
二、如何理解教育与社会差异之间的关系
有关综合素质评价政策的争论,不仅体现在问题的认定上,如是否教育不公平,还体现在对改进综合素质评价的政策建议上。尽管大家基本上都赞同需要对目前的综合素质评价政策作出改进,但不同的人所开出的处方却很不相同。其中,有一种观点比较突出,那就是认为应该根据现实存在的农村和城市二元结构,而分别制定适合农村和城市的综合素质评价标准。这又以劳凯声和熊丙奇两位教授在2009年9月2日中央电视台新闻频道“新闻1+1”栏目中所发表的政策建议作为代表。②
在访谈中,两位知名教授都认为综合素质评价政策不利农村学生,加重教育不公平,而且不约而同地提出了这样一个解决方案,那就是分别针对农村学生和城市学生设计一套综合素质评价方案。这可以证之于劳凯声教授的一段访谈实录:
“我想农村的孩子和城市的孩子,因为他们生活的背景不一样,接受的教育也有很大的差异性,我们搞两个不同的版本,根据这样一些不同版本,使得录取的工作做得更客观一点,我想是可以的。”
本节目主持人接着又对嘉宾的意见做了更直接的表述:“两个版本,既然是城乡二元,不妨也体现在高校招生的时候,我们也来个二元,面对农村学生有农村学生的办法,面对城市学生有城市学生的办法。”
事实上,以上的这个政策建议涉及到了一个非常基本也是不断会出现的问题,那就是在面对客观存在的社会差异(包括地区差异、阶层差异等)时,教育应该如何定位自己的角色和作用。在遇到这个问题时,一个常见的解决思路是强调教育要承认和适应客观存在的社会差异,根据这种差异对教育进行相对应的调整,即教育要“因地适宜”、“因材施教”,寻求“有差异的平等”。显然,上述的政策建议是体现了这样一种解决问题思路。其实,之所以说这是一种常见的问题解决思路,那是因为不仅仅是这个政策议题中这些专家会如此想,其他专家学者在其他政策议题中也经常会采用这样的问题解决思路。例如,新课程中的“校本课程”,以及“绿色证书”,甚至高考的分省命题等政策的背后都体现了这个认识思路。
本文不就这个观点本身对错进行讨论。实际上,正如后文所阐述的,没人能确定它合理与否。本文想借此话题进行讨论分析的一个主要目的是表达这样一个观点,即这个问题其实也没有我们所想象的这么简单,在客观社会差异中办教育,教育就应该主动适应社会差异,这并非是唯一合理的选项,也并非必定就是合理的。在许多时候,与之完全相反的做法,即忽略社会差异,强调不同人群的共同教育经验,这也可能是对的。这才是问题的复杂性,而我们对此要有足够的认识。
我们知道,教育是一种重要的社会控制机制。国家通过教育来控制社会,其中一个重要的方面就是要通过教育来实现社会各群体之间的融合,从而实现社会凝聚和整合。教育的这个社会控制功能一直被国家所重视,而且也被民众所认可,一些教育经典文献中有关教育应该促进社会融合不是分裂的论述,也经常被人们看作是一项基本的教育理想和社会理想而广为传诵。
那么,教育怎么来促进社会融合呢?简单地说,它就是通过减少那些可能会造成社会各群体隔阂、分裂的因素来实现社会融合。但哪些因素可能会造成社会群体之间的分裂呢?血缘、肤色、民族、性别、宗教信仰、地域(包括城乡)都是常见的因素。历史已为我们提供了充分的证据,共同的教育经历是有助于不同血缘、肤色、地域、民族、性别和宗教信仰的人相互理解,最终实现融合共处的。但另外一个非常重要的,但经常被人忽略的因素是知识。已经有大量的教育社会学研究表明,制造社会差异的一个非常重要的途径就是给不同的社会群体分配不同的知识,或者说是提供他们不同的机会去接受不同知识。[3]国外历史上许多教育政策,如文法学校,一直被猛烈批评为是社会分层机制,就是一些有关知识差异造成社会差异的典型例子。
所以,如果从这个角度来看,那么仅仅是因为现实已经存在着城乡二元结构,就分别给农村和城市设置不同的评价标准,那么它实际上就等于给不同的人群分配不同的知识。例如,对农村学生考察的是种田能力,而对城市孩子考察的是钢琴能力,久而久之就会变成农村学生学习种田,而城市孩子学习钢琴。长此以往,城乡学生的区别会越来越明显。而且,相比其他的因素(如贫困、地域),知识的差异可能更难以消除。
当然,这并不是说教育应该主动适应客观存在的社会差异这样一个思路就是错的。例如,一些人可能会认为,强调共同教育经验应该是在大学里,而要达到这个目标,首先就要根据城乡客观差异,让每个学生都有相同的机会进入大学,否则大学这种共同的教育经验就无从谈起。实际上,对于如何改革考试评价制度这个“题目”而言,强调教育要适应地区差异这个“答案”本身可能是对的,历史上也曾有许多成功的经验。但笔者不惜矫枉过正地提出它的“对立面”,其意在说明无论答案本身是否正确,但其“解题过程”需要再精致和复杂一些。
因为对政策分析来说,推理说服过程可能比最后的观点结果更为重要,这就如皮亚杰和科尔伯格都是用推理过程所表现出来的理智水平,而不是观点本身对错,来判断学生的智力发展水平和道德发展水平一样。对许多政策议题而言,最后的观点无非在“是否”两者之间做选择,就如海因兹是否应该去偷药给妻子治病一样,只有通过具体的政策论证过程才可以看出我们对某个社会议题的认识程度和理性水平。而提升决策者、公众等社会群体对某个政策议题的理解水平是政策分析者的一个基本社会责任。这就意味着,在考试评价制度改革过程中,无论我们最终提出的是哪一个具体的政策建议,我们首先都应该对特定问题的复杂性有深刻的认识,要认真地分析可能的备择方案有哪些,清晰而有说服力地阐述我们为什么最终选择了这个方案而不是其他方案。只有这样,政策建议才可以说是真正基于研究,而不是在“碰运气”。
三、如何理解诚信制度对改革的制约作用
除了教育公平之外,引发大家对综合素质评价政策讨论的还有另外一个与此有关但不尽相同的议题,那就是改革过程中可能出现的诚信问题。许多质疑者就认为,综合素质评价不像高考一样有一个客观的分数,有一套严格监管的程序,而是依赖学校教师、大学招生人员的主观判断,这会诱发大量的“腐败”和作假,从而使评价结果不可信。这可以发表在2009年9月7日《人民日报》的一段专家访谈为证:“但是我比较担心的是,综合素质评价是否科学、客观、公平?连民族成分都能造假,何况是老师的评语,能有多大的公信力?”[4]从网络留言等渠道所反映出来的意见来看,大部分公众也同样有这样的担心。在他们看来,诚信制度建设是考试评价制度改革的一个前提条件,没有这个配套背景制度的支持,考试评价制度改革必然是徒劳无益,甚至是有害的。
但在一些改革的支持者看来,这种因为担心腐败问题而不敢尝试改革的想法并不具有建设性。他们认为,“不能以‘想象的腐败’来否定改革尝试”,“信任更需要勇气,只有相信,改革才能向前推进,一味地怀疑和否定只能使一切停留在原地。”[5]
显然,这个争论的一个核心问题就是,怎么理解诚信制度对综合素质评价政策的可能制约作用。有些人认为如果对这些社会背景视而不见,政策必然是徒劳无益的,所以必须对此问题持高度敏感状态;而有些人则认为,如果对于这些问题过于敏感,是不可能营造良好的改革氛围的,最终只能是原地踏步。应该说,相比前两个议题的讨论,双方对这个议题的分析讨论要深入一些,也基本上已经聚焦在正确的问题上讨论了。但我们仍然可以把这个问题的分析再深入一下,挖掘这个核心问题背后的更深层次矛盾问题。
在笔者看来,与前面两个议题一样,我们同样很难简单地说哪一方的观点就是对的,这是一个非常复杂的问题,而这个复杂性很大程度上是由于制度与政策过程之间复杂矛盾关系所造成的。制度不仅是作为变量在影响政策过程,而政策过程其实也同时在构建制度。具体到本研究上来说,那就是诚信制度是会影响综合素质评价政策的效果和方向,但有关综合素质评价政策是否会导致腐败的讨论本身,事实上也是在构建社会制度,而且这种制度又反过来影响政策的选择和实施。抓住这一对深层次的矛盾关系,有利于我们更加清楚地分析前面所提到的这些争论问题。
诚信制度是影响综合素质评价政策的一个重要变量。任何政策都不是在真空中发生和运作的,而是在充斥着各种各样已有政策和制度的社会空间中进行的,而这些已经存在的政策和制度就会对这项新政策产生影响,有能力对政策压力形成制衡,会把政策效果导向某个特定的方向,从而使得政策或者政策制定者难以完全控制政策过程和政策结果。[6]也正是因为已有的社会制度往往会成为政策实施意图的阻碍者,所以我们才经常会看到政策变革并不是一件容易的事情,并不是政策制定者想做什么就能够做什么。对考试评价制度改革而言,人情、腐败等诚信问题就是改革所面临的一个基本制度背景,所以,我们有足够的理由来怀疑在这样一种制度背景之下,综合素质评价政策会不会从“好政策”变成了“坏政策”。毕竟,这样的例子历史上已经有很多了。
但问题的复杂性在于,综合素质评价政策过程中有关诚信制度的讨论本身也是在强化和构建一种特定的制度,它又反过来会对相应的政策过程产生影响。制度的形成和发展是一个社会集体参与构建的过程,这在政治学和社会学研究中已经基本成为了共识。而在社会构建的过程中,概念往往起着关键的作用。因为社会本身是一个包罗万象的集合,我们任何人都不可能注意到社会的方方面面,而只能有选择的注意某一些我们认为是重要的东西。而概念的作用就在于能够让我们对其中一些东西更加敏感,让我们相信这些东西是重要的。所以,当一些概念或者议题不断地被用来分析和讨论社会问题的时候(这个过程可能是无意的,但也很可能是某些组织或者个体精心操作的结果),就意味着大家都认为这东西是重要的。而这样一种共同的思维方式就像习俗一样,本身也是一种制度,或者更准确地说是文化-认知层面的制度。[7]所以,当许多人不断地用诚信、腐败等概念来分析考试评价制度改革时,就意味他们正在不断地强化一套特定的思维方式,那就是在遇到任何改革政策时,首先去检验它是否存在着腐败空间。而当它强化到一定程度,即有足够多的人都会以这种方式去思考问题的时候,制度就形成了。而不同的制度对不同类型行为的偏好可能是不同的,有些制度能够鼓励更多的创新行为,而有些制度则更鼓励保守行为;有些制度能够增加社会信任,而有些制度则会增加社会协调成本。因此,在政策讨论过程中得到强化和形成的制度也同样会反过来影响政策。
所以,一个更值得讨论的问题可能就是,当我们形成这样一种制度时,即以是否存在着腐败空间作为一个主要的指标来考察和评价一项改革政策的合理性,这是否对社会发展和教育改革具有建设性呢?在笔者看来,它所带来的其中一个后果就是,那些在理论上不能杜绝“作假”、“腐败”问题的政策议题往往就会被否决,哪怕它可能从长期来说是对社会有利的;而那些可以用统一的、客观的测量标准来代替人为判断的政策就会得到拥护,哪怕它是多么地机械和死板。
如果我们考试评价制度改革的目标是改变当前这种一切以考试分数为评价标准的机械做法,而试图构建一个更加开放、灵活的考试评价制度体系的话,那么这套制度就会使政策创新变得非常困难。迫于公众可能会批评他们不公正、“腐败”的制度压力,校长在推荐学生的时候不得不选择严格按分数高低来推荐那些本来就考得上北大的学生,最终使得“校长推荐制”沦为“掐尖”行为。北京大学等高校推出的“校长推荐制”在当前所遭遇到的困境,就是大家对诚信问题过于敏感所带来的一个代价。
至于这种制度以牺牲改革创新行为为代价,获得了部分公众心理上的公正感和透明感,即减少了主观感受中的不诚信行为,这样的结果是不是合理,则可能是一个仁者见仁、智者见智的问题。但我们至少应该知道,一些看似非常合理的事情还可以从另外一个角度来分析,而且它所得出来的结论可能很不一样。例如那些综合素质评价政策的支持者,反对动辄以诚信、腐败问题来对各种政策进行严格的检验,也可能是有远见的。因为,对腐败、不公正过于敏感的社会情绪和思维方式所构建出来的制度环境可能并不是很积极,很有建设性。许多疑问也许在当下看似非常合理,但从长远来看则是没必要的。一个典型例证就是,在改革开放之初,同样有很多人认为改革必须首先考虑它“姓资”还是“姓社”这个问题,但事实证明,这是没有必要的。相反,如果大家都是动辄以是否符合社会主义基本教义来检验各种改革创新行为的话,那么就肯定没有今天这样的成就。
当然,这并不是说我们就不需要关注诚信问题,或者那些关注诚信问题的人都是“短见”的。本文想传达的一个意思是,我们需要以一种更加复杂的思维来看待和分析政策议题,复杂的政策议题大多不会是只有一种正确答案。许多我们看似肯定合理的做法,比如要充分关注考试评价制度改革中的诚信问题,可能从另外一个角度来看,就会发现这样做也是有代价的。至于这些代价是否必需、合理,那就是一个更深入的问题了。而引出这样一些更深入的问题,促发大家就这些基本问题进行深入的辩论,则是本文的根本目的。
注释:
①笔者曾经作为一个课题组成员接受过教育部有关司局的委托,展开有关综合素质评价政策的国际比较研究。在一次内部通信中,教育部的一位官员就提出了他们对综合素质评价制度的理解是“指向学生综合发展的评价”。
②访谈的主要文字稿可以在央视网站上找到,具体地址为:http://space.tv.cctv.com/act/article.jsp? articleId=ARTl1251942094387559&nowpage=0。除有特殊说明之外,本部分有关引言全部出于此处。