作为政策工具的大学排名_麦克林论文

作为政策工具的大学排行榜,本文主要内容关键词为:大学排行榜论文,政策论文,工具论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

包括大学排行和排名报告(或成绩调查)在内的各种排行榜,一般是运用从高校或公共部门获取的客观或主观数据并向有关竞争对手的比较单位赋值进行“质量测量”而构建起来的。

相对于其他大学和培养项目的绩效来说,排行榜中所运用的各种指标主要是用来衡量如何建立一种系统(投入变量)、系统的运行方式和内部效率(过程变量)以及系统的生产率与影响(产出变量)。开展比较排行的各个媒体和机构出于不同的目的,会强调不同层次的变量,这突出体现在指标的选择和权重的设置上。

有些排行是在某一类型高校内进行的,这使得各高校可以在同一个平台上以其不同的使命和发展取向展开竞争。有些排行是在所有高校中进行的,还有些仅是在具体培养项目而非整个院校层面上进行的比较。

本文主要考察排行榜和划分第三级教育机构类似的一些工具,尤其是这些工具作为公共信息机制及高校向学生提供教育质量信息方式的作用和效果。

一、排行的种类及相应的绩效责任机制

(一)发展的模式

大学比较活动可追溯到1981年的鲍勃-莫尔斯在《美国新闻与世界报道》开展的大学排行。[1]但实际上,最初由学者或教育机构所做的第三级教育机构排行则是在更早的20世纪初。最初,高校学术排行只是判断高校办学效益的一种评估方式而已。[2]后来,作为一种质量量度的声誉以及作为可靠信息来源和机制的同行评议越来越受到重视,并被计算在各排行之内。例如,1959年,肯尼斯顿在排行过程中就曾以博士科研质量和教师学术质量为主要标准,邀请25位高校的系领导评选出各领域实力最强的系。[3]

排行榜的广泛应用并成为一种普遍现象迄今仅有不到10年的历史。阿舍尔和萨维诺2006年的研究报告显示,在19个排行榜中有11个是2000年以后出现的。其中只有《美国新闻与世界报道》大学排行、加拿大的《麦克林》大学排行、波兰《展望》与《共和国报》大学排行、英国“泰晤士优秀大学指南”和中国“广东管理科学院大学排行”的历史稍长一些。排行榜的泛滥与世界范围内高等教育大众化的发展或者说高等教育入学人数的膨胀不无关系。此外,跨境私立和远程教育提供者的涌现、第三级教育国际化的浪潮以及社会各方面对提高绩效责任、透明度和效率的呼声都对质量的量化评定起到推波助澜的作用。甚至潜在的经济利益也成为人们竞相推出排行榜的一个动因。

考察排行榜发展模式的一个特殊的方式,是从各地区的分布加以考虑。表1显示,各国各地区排行活动发展并不均衡,相比之下,在工业国家更为盛行。排行榜的排行结果会因实施排行机构的不同而有所变化。首先,排行榜会影响公众的判断,尤其是报刊所进行的排行。在某些情况下,例如在阿根廷和巴基斯坦,排行已成为认证过程的一个步骤。另外,像英国和新西兰所开展的科研成果排行还会直接影响到政府对相关院校的拨款。

(二)排行榜的特征

近来,有很多文章对各种排行榜进行了广泛的探讨,并对其方法论上的缺陷进行了批判性的分析。这些文章深入剖析了排行榜的概念和理论基础,详细阐释了用作质量量度的各种指标,对排行所用的方法及其各方面的缺点提出批评意见。一般来说,排行榜具有如下一些共同的特征。

第一,都以一套或一组指标作为质量量度。各种指标通常都划分为投入指标、过程指标和产出指标三大类。阿舍尔和萨维诺将其概括为七大类指标框架。(1)学生质量:学生的高中总平均成绩、学校的选拔性等入学条件;(2)资源投入:学校提供给教师和学生的财力与物力资源、学校的经费状况;(3)师资投入:教师资格、师生比、分配的工作量以及授课时数;(4)教育产出:所获的技能、学生巩固率和学业完成率;(5)最终成果:就业率、研究生院录取率、工作满意度;(6)科研质量:论著、奖项、论文的引用率以及论文影响因子、科研经费、专利数量等;(7)声誉:同行、学术行政管理者和雇主的意见。一般比较有名的排行榜在每个维度上都会使用多种指标量度。

第二,每套或每组指标都会被赋予一定的权重值。各排行榜指标的权重都会有所不同,权重的设置使理念和排行榜推出者的意图得到更好的体现。[4]权重是一个随意的和主观的因素,这也是排行榜方法论中一个根本性的缺陷。[5]这种随意之举会使人们发觉,权重和计算公式可能每年都在变化。

克拉克曾对《美国新闻与世界报道》的“专业研究生院排行”和“本科文理学院排行”的四种变化因素进行六年多的跟踪研究发现,在全部的变化中有85%是权重、定义和方法上的变化而非增加或减少指标的问题。研究生教育排行的变化要大于本科生教育排行,同时,相对于一般学科来说,一些专业学科领域(如法律)排行的变化更为突出。在克拉克所考察的《美国新闻与世界报道》六年的排行榜中,平均有6~8个计算公式的变化,而最大的变化则在少量的指标上。克拉克认为,计算公式的变化将无法对一所院校一定时期内的业绩进行比较。如果一定要进行比较的话,只能从一个断面上考察那些长期保持稳定的指标。[6]

第三,排行榜都有其具体的比较单位,这种比较单位可能是院校,也有可能是特定的培养项目(如MBA)。国际性的排行榜通常是以院校为比较单位,而且也不区分院校的规模或类型。而在国内层面上,很多排行榜都是按照高校的类型进行排行。例如,加拿大的《麦克林》主要针对医科或具有博士授予权的高校、综合性高校和以本科教育为主的高校这三类高校进行排行。但有人认为,对使命不同、资源状况不同的院校进行比较这本身就有方法上的缺陷和不当之处,[7]也是对社会不负责任的做法。[8]由于一些规模较小的高校和非研究性高校在有关科研和声誉的指标上不可能获得高分,因此,排行无意中造成对这部分高校不利的局面。

第四,在很大程度上依靠同行评议的方式来收集数据资料。有些排行会邀请学界人士、行政管理人员和雇主据其对院校或培养项目声誉的看法进行排序。即使《泰晤士高等教育副刊》2005年排行榜的编辑一再声称这个过程是可靠的,有些人还是根据不同的理由对这种做法提出批评,他们的理由包括:晕轮效应会使他们做出糟糕的判断;[9]对评价者来说,由于没有一个共同的质量参照框架,因此,他们的意见是非常主观的;[10]由于评价者缺乏对评价对象的充分了解,所以,他们做出的判断未必准确。[11]此外,排行榜也经常会使用其他一些数据资料,其中包括由政府部门、文献引用索引机构、专利局以及诸如诺贝尔评奖委员会这类机构开展的调查和发布的数据等。

排行榜普遍具有的这些特征与认证等其他院校评估方式存在着很多的相似之处。例如,两者用于考察院校资源情况的很多指标(教师和学生数、毕业率与保持率等)都是相同的。而且,两者对同行评议都非常倚重。

但是,排行和认证这两种活动也明显有所不同。认证更侧重于培养项目上,并以确定的、绝对的规格和标准来衡量院校的工作。而排行榜对院校工作的衡量则是相对的,因为它是基于一整套标准对各个院校和培养项目的比较,而且其结果是以等级顺序呈现出来的。另外,认证和排行对声誉和科研产出的重视程度也各不相同。

二、爱恨之间

高校和各有关方面需要以平常心来对待排行榜,这是肯定的。如果学生太看重排行榜的话,大学行政管理人员对其就会有所畏惧。国际排行的结果总是几家欢乐几家愁,媒体和政党更是乐于把它作为抨击政府的武器。而世界范围内的大量事实表明,政府和高校对大学排行的回应则是语言和行动。

例如,2005年9月,《泰晤士高等教育副刊》发布的最新排行榜显示,马来西亚两所顶尖大学的排名比前一年几乎下滑了100位,尽管排名的急剧下滑部分是由于更改排行方法所致,但是,马来西亚反对党领袖还是要求政府成立皇家调查委员会进行调查。

同时,围绕排行时常会爆发激烈的纷争,甚至还引发了联合抵制和法律诉讼事件。例如,20世纪90年代初,斯坦福大学的一群激进学生在号召有关大学和学院联合抵制《美国新闻与世界报道》大学排行未果的情况下,成立了名为“遗忘《美国新闻与世界报道》联盟”的团体。1997年,美国中密歇根艾尔马学院院长在组织有关高校联合抵制排行的行动未果后,开展了对150多位大学和学院高层领导的调查,以反映他们对《美国新闻与世界报道》排行的意见。[12]

当《亚洲周刊》在1997年和1998年推出首份亚太地区大学排行榜后,1999年有35所大学拒绝参与该刊的所做调查,其中多半是日本和中国的大学。抵制行动导致该刊排行的最终流产。有趣的是,每次都位居榜首的东京大学也决定1999年后不再参与该刊的排行。正如东京大学校长莲实重彦做出的解释,“我们教育和科研的质量无从与其他大学相比较”。[13]

《麦克林》自1991年开始大学排行以来,围绕排行引发了很多的争议而且一直持续至今。当年《麦克林》大学排行榜发布之际,就因调查中不当的措辞和设计,无视高校的使命、规模和隶属关系的不同而将所有高校放在一起排行,以及只有一个经加权计算的总分而并未公开所用的方法体系,引起学术界的强烈反对。此后几年,该刊对调查做出很多调整,其中有些是根本性的变化。调整的内容包括重新编制调查问题以及按照医科或具有博士授予权的大学、综合性大学和本科教育型大学三个类别进行排行等。在1992年以后的调查中,《麦克林》也开始提供调查方法的说明。1993年,纽芬兰纪念大学和卡尔顿大学因反对《麦克林》所用的方法而拒绝参加排行。[14]学术界对排行弊病和方法缺陷的关注集中体现在1994年麦吉尔大学新任校长伯纳德·夏皮罗写给时任《麦克林》年度大学排行榜执行编辑安妮·庄斯顿·约翰逊的信件中。同年,加拿大15所大学宣布不再参与《麦克林》的大学排行。1995年,魁北克的法语大学集团也同纪念大学、马尼托巴大学以及蒙克顿大学一道退出排行。但是,出于比较的需要,这些大学仍以类似的方式继续向加拿大学院和大学协会(AUCC)提供数据资料。

最近,加拿大麦克马斯特大学校长彼得·乔治指出,虽然《麦克林》排行在促进信息标准化以及发现优势与不足方面具有一定的积极意义,但很多大学都在考虑退出这个每况愈下的排行。如果说多伦多大学等一批高水平研究型大学退出《麦克林》过去两年所做的毕业生调查以及安妮·庄斯顿·约翰逊出走《麦克林》,表明有关当事者的不满和分歧正在不断蔓延的话,那么,《麦克林》年度排行可能在不远的将来就会成为历史。

2004年3月,新西兰两所大学成功地说服政府取缔使它们在与英国和澳大利亚竞争对手比较中处境不利的国际排行榜。两所大学的校长担忧,排行会对其吸引国际自费学生的能力造成负面影响。最终,政府只允许发布国内第三级教育机构的排行榜而不准许与海外高校进行比较。新的排行主要是侧重于新西兰22所第三级教育机构的5 570位研究者的科研业绩状况。[15]

尽管不像别的国家那么引人注目,但荷兰也发生了类似的具有争议性的事件。2005年,荷兰教育部进行首次大学排行并将结果通报给有关大学,当最有名的一所大学发现结果低于预期的排名后,深表愤慨,并威胁要向教育部提出诉讼。最终,该大学没有起诉,而教育部仍在进行排行并将结果公布在网站上。

从将参与原则视为充斥着竞争的“盎格鲁—撒克逊”文化的典型产物或对大学自主无可容忍的践踏,到对方法论瑕疵的全面批判,其中包括调查的设计、指标的遴选、每个指标权重的设置以及排行所依靠的数据库等,反对者们常会质疑排行中的每一个要素,并以谬误和不切实际为由拒绝接受排行的结果。多数情况下,批评源自高校对其排名位置的不满。相反,获得好名次的大学则越来越喜欢把排名结果用到广告宣传中,尤其对那些希望吸引海外学生的大学来说情况更是如此。

高校选择不参与排行活动,其结果并不都是否定的或有损于高校。美国里德学院(Reed College)就是典型的例证。由于学院拒绝向《美国新闻与世界报道》提供数据信息,根据该刊收集来的估算数据,学院在排行中处于垫底的位置。但是,此后学院的入学申请不仅大幅增加,而且很多学术水平考试(SATS)的高分考生也发来申请并被录取。目前,里德学院成为全美最好的和入学竞争最激烈的文理学院。

三、谁是赢家

排行活动是一种以平等规则面向所有高校展开的公平游戏吗?如果仔细研究一下2005年上海交通大学和《泰晤士高等教育副刊》两个国际排行榜上的前100所大学就会发现,其实并非如此。这些排名靠前的高校具有一些共同的特点,从中也引发对国际排行榜合理性的强烈质疑。

第一,两个榜单上的成功高校都出自以英语作为官方语言和教学语言的国家(地区)。在上海交通大学2005年的世界大学排行中,前100所大学中,有68所来自英语国家(地区)(其中美国53所、英国11所、加拿大4所)。同样,在《泰晤士高等教育副刊》2005年的世界大学排行中,前100所大学中有60所来自英语国家(地区)(其中美国31所、英国13所、澳大利亚12所、加拿大3所、新西兰1所)。此外,前100名的大学中另有11所大学开设至少一项以英语教授的研究生培养项目(丹麦、芬兰、以色列、荷兰、挪威、瑞典和瑞士)。

第二,两个榜单中前100名高校中绝大多数出自对高校进行国内排行的国家,例如,美国、英国、加拿大、澳大利亚、日本和中国。这是很容易理解的,对排行的熟悉以及搜集、发布数据信息能力的完善使高校得以走向国际排行榜的前沿。意大利和西班牙是个例外,尽管它们都有本国的排行活动,但是,在《泰晤士高等教育副刊》的前100强中没有两国的大学,而在上海交通大学的排行榜中意大利仅有1所大学上榜且名列第97位。

在上海交通大学排行的前100强中,92%是北美和欧洲的大学。在此榜单中,日本是唯一一个有5所大学进入前100强的非西方世界国家。而《泰晤士高等教育副刊》的前100强在美洲、欧洲和亚太地区的分布相对来说则更为均衡。对比表2和表3可以看出,缺乏排行活动尤其是缺乏国内排行的地区有些不一致。或许正是这种不一致造成那些缺少第三级教育机构排行传统的国家或地区没有一所高校进入《泰晤士高等教育副刊》大学200强或上海交通大学排行500强行列。

第三,高校科研能力主要是以科研经费、捐助以及国家直接和间接的高等教育研发(R&D)经费为支撑的。例如,在国际排行榜排名最高的3所加拿大大学,同样也是科研经费收入最多的大学。同样,第三级教育研发经费占国家研发总经费比例越高的国家,其高校就越有可能获得更多的资源,从而跻身于国际排行榜。显然,国际排行总是垂青于研究型大学,而将那些优秀的本科教学型高校甚或是那些拥有大量科研活动和研究生培养项目却被归为综合性高校挡在门外。将《麦克林》2005年综合类排行前3名的大学与其在《泰晤士高等教育副刊》和上海交通大学排行榜中的位置加以比较,便可以说明这种不利情势(见表2)。

同样,国际排行榜也总是偏好那些私立或精英型高校。“在过去30年中名气和业绩不断攀升的大阪大学一直被视为一所高水平的公立高校。即便如此,它还是不可能排在京都大学或东京大学之前。”[16]以私人部门资金作为高校主要经费来源的国家在排行榜中也格外引人注目。根据经合组织统计数据,这些国家包括澳大利亚(私人经费约占52%)、日本(约占51%)、美国(约占45%)、加拿大(约占42%)和英国(约占28)。

四、排行榜能否测量质量

由于种种原因所致,排行榜中使用的指标与教育质量指标之间的相关性仍是很模糊的。

第一,目前还没有一个适用于各种类型和使命的高校公认的质量概念,c只有个别排行榜是将所有大学等同视之的(《麦克林》和《美国新闻与世界报道》)。特纳认为,由于缺乏确切的功效标准以及分辨投入、过程和产出的能力,最终排行榜只能用一套各不相同的比较仪(comparator)来比较高校。[17]

第二,排行榜使用的一些典型分类指标(声誉、教师科研成果、学生学业成果等)与质量之间的关联还缺乏理论性和实证性的依据。[18]例如,派克发现,“全美大学生认同感调查”信息与《美国新闻与世界报道》排行并无什么直接联系,这表明学生对其教育经验的印象受到多种输入变量的影响而非排行榜所衡量的高校特色。[19]

第三,基于各种完全不同意义的指标进行加总并得出总分,这种方法本身就存在着理论上的缺陷,过于简单化,“在数学上……也是站不住脚的”。[20]如表3所示,左栏是阿舍尔和萨维诺对指标做出的分类;右栏是从现有文献中整理出的支持指标,是一种质量量度的实证性研究。阿舍尔和萨维诺指出,排行系统的作者们相信,每个指标都是合适的质量标示符,经过适当的加权和加总,这些指标就可以构建出合理而完整的质量“概念”。而我们的结论是,绝大多数指标可能只是一些潜在特征的附带现象,它们是无法测定的未知数,这其中包括学校校龄、教师规模、生均开支等。[21]

第四,在不同的排行榜上测量的同一概念所得出结论经常是矛盾的。在一项比较研究中,迪尔和苏主要通过四个维度(即投入、过程、产出和声誉变量)考察了研究中所选的5个排行榜的一致性问题(也就是对质量的概念化表述)。他们得出结论认为,不同的排行榜之所以会具有一致性,主要是因为它们都或多或少地使用了相同的投入量度(教师、学生、财力资源以及设备设施等)。而过程和产出量度的不一致显然并没有影响到它们最终的结果。[22]然而,在最近的一项比较研究中,阿舍尔和萨维诺却得出相反的结论。他们在对19个排行榜中各项指标进行分析后认为,按照各排行榜对质量定义的方式,它们根本不具有一致性。他们认为,两项研究的结论存在巨大差异的主要原因在于,他们选取了更大的样本(19个排行榜)并基于已进行的比较选取了更多种类的指标(共有七大类指标)。[23]

第五,各排行榜的排名结果也存在着矛盾。就《泰晤士高等教育副刊》和上海交通大学排行榜的前50所高校来看,只有42%的高校同时进入两个榜单,只有1所高校在两个榜单中排名相同;在两个榜单中,排名相差5位的高校占24%,排名相差10位的高校占8%,排名相差10位以上的高校占22%。对比加拿大大学在2005年《泰晤士报高等教育副刊》和《麦克林》上的排名可以发现,只有前两所高校的排名结果是相同的。而在《麦克林》和上海交通大学的排行中,只有1所高校在两个榜单中位次相同(都处于第6位)。总之,各排行榜中除了前8所高校比较接近以外,其他名次的高校则是完全不同的。

将有些国家认证和排行的结果加以比较同样很有启示意义。例如,在南非,《金融邮报》曾连续多年编辑并发布该国MBA项目的排行榜。2005年,南非高等教育委员会的认证机构也开展了对全国MBA项目的评估,并根据评估结果取缔了三分之一的项目,其中还包括两个国外开办的项目。另有三分之一的项目需进行有条件的认证。有趣的是,认证与排行的结果毫无一致性可言。实际上,一些被取缔的项目还在MBA排行榜中位居前列。自从这个事件以后,《金融邮报》调整了排行的方法并改变了有关指标的权重。

五、排行能否发挥建设性作用

虽然存在着这么多的概念和方法上的局限,但我们应如何解释人们对大学排行的热情?同时,为以建设性和批判性的方式更好地利用排行榜所提供的信息,应向政府、第三级教育机构以及公众提出哪些建议?

(一)政府层面:作为质量保证机制替代者的排行

在一些评估或认证机制尚未建立起来的国家,排行可有效用于监督和提升质量,在此方面德国和巴基斯坦便是例证。20世纪90年代柏林墙倒塌后,西德科学理事会(West German Science Council)的专家组开始承担其评估东德大学的任务。专家组在执行这一任务的过程中逐渐认识到,在缺乏评估传统的东德大学中,他们不得不像过去那样采取新的方法。

1998年,作为独立政策研究机构的德国高等教育发展中心与德意志学术交流服务中心及其媒体伙伴《时代周报》共同开展了排行活动。由于德国是个联邦制国家,大学的资助与监督主要是各州的责任,因此,该排行也成为德国首个提供全面质量指标的综合性体系。该排行的调查囊括了132所大学和148所应用技术院校(Fachhoch schulen)的数据信息,超过21万名学生和约2.1万名教授参与了调查。德国高等教育发展中心只是按大学和应用技术院校两大类公布详细的教师,学生调查信息以及第三方信息。为有效利用所搜集来的信息,德国高等教育发展中心对六类主要的指标(及亚指标)进行了排行。(1)教学与学习:电子化学习、学生间的联系、教师与学生的联系、开设的课程、课程的组织、实习学期的支持、咨询和教学评估;(2)资金/设备资源:多媒体设备、教室、图书资料、工作站;(3)劳动力市场与职业倾向:与劳动力市场相关的项目;(4)教授和学生的总体意见:总体评价、科研声誉、教授指导;(5)科研:授予的博士学位数、出版物的国际影响、其他出版物、第三方科研经费;(6)学习地点与高等教育机构:校内运动、低房租/生活费、小学院位置、校际运动比赛。

对数据信息感兴趣的人可以对比某项或某些指标来考察每所大学或具体学科的位置。读者甚至可以根据所关心的指标做出自己的排行榜。德国高等教育发展中心这种方法的好处在于避免了由于大学自行报送数据所造成的偏失。

在巴基斯坦,当设立于2000年的一个国家特别工作组指出该国第三级教育的糟糕状况后,政府进行了大规模的改革并率先成立了高等教育委员会。除了第三级教育管理和财政安排上的剧烈变革外(包括大学领导的遴选、大学董事会的创设、财政投入的增加、公式化拨款的引入),改革还提出要建立一个认证机构用以监督和提升巴基斯坦公立和私立大学的质量。但是,考虑到对大批培养项目进行认证需要花费很多年时间,高等教育委员会决定开展排行活动,以此作为评估现有第三级教育机构质量的捷径。

为促进整个第三级教育系统的快速、全面发展,尤其是提升巴基斯坦在世界经济格局中的位置,巴基斯坦高等教育委员会于2002年直接发布命令,要求开展大学评估活动,并在随后推出大学排行。通过对高校投入和产出的比对,巴基斯坦建立了奖励优秀高校和激励高校改进的机制。高等教育委员会在排行中所使用的五项主要标准与很多国家的排行指标相类似。具体而言,这些指标包括:教师(占25%)、科研成果(占25%)、学生(占20%)、设备设施(占15%)、经费(占15%)。从上述情况可以看出,巴基斯坦大学排行主要侧重的是教师水平和科研成果而非其他一些指标(学生入学质量、学校基础设施等),这表明巴基斯坦完全采取了西方大学的评价模式,而这种加权指标方式无疑会引发有关排行与当今巴基斯坦第三级教育系统发展的更多争论。

排行结果发布与否是由一个对排行进行监督的咨询委员会来决定的,该委员会主要由高等教育委员会的官员和大学的代表组成。有所公立大学的副校长曾因该校得分太低而提出强烈抗议,后来咨询委员会同意不公布该校的排行结果。在这种情况下,高等教育委员会往往将主要基准信息,尤其是与每项排行标准相对照而得出的相对位置,通报给有关大学。

虽然高校普遍反对发布排行的结果,但此举至少在两个方面产生了积极的效果。首先,它迫使高校更认真地对待数据采集工作。在首份排行结果的草案出炉之际,多数大学的代表都觉得难以接受,并认为数据存在明显的错误。但后来证实各高校所提供数据的确存在问题时,他们才认识到采集和提供准确数据的重要性。在第二轮数据采集中,数据的可靠性得到了很大的提升。

同时,排行也促使巴基斯坦政府通过双方共同采取的手段,历史上首次就教育质量问题与大学展开深入的对话。值得注意的是,排行计算中所包含的一些标准,如具有博士学位的教授的比例,也成为向公立大学分配经费所使用的新拨款公式的一部分。

需要强调的是,只有赋予大学和其他第三级教育机构充分的自主权,使其能够按照自己意愿进行课程和教学的改革,政府才能指望这些机构更好地改善质量,提高培养项目的适切性。当然,为改革提供其他一些资源,如资助高校招聘国内外高水平教授和研究人员等也是非常必要的。另外,巴基斯坦的高等教育委员会还就此设立了一些专项基金用以支持大学提升培养项目的质量。

(二)第三级教育机构:作为一种基准工具的排行

虽然排行的结果充满争议,但有些大学则一直希望能够保持自己在国际排行榜上所取得的排名。一些新兴国家的大学同样热切期待成为“世界一流”大学,而且它们常常把进入国际排行榜中的一流大学之列作为自己的目标。

如果排行能促使高校对其工作进行回顾和反思,并在此基础上为高校乃至国家的发展设定新的目标,那么,排行就可以对高校的改进产生积极的影响。例如,日本等国发现,在国家层面上开展排行是有益的,它可以促进系统信息的采集和基准的推行,并有助于重大质量改善计划的实施。[24]虽然排行的总体情况能够传递出各种信息,但是,各个指标间的比较也可使高校发现自己的优势所在。

当排行活动本身成为一种目的而不能有效测量质量改善情况的时候,对排行的倚重就会潜藏着重大的风险。学术机构只有主动去识别那些真正可以测量教育质量的指标才会有所收益。毕竟,学者们有知识、有能力根据事实做出正确的结论。通过制定一些合理而有意义的教学质量指标,高校可以在认识教学和科研等全部学术活动上迈出坚实的一步。[25]高校还应在与媒体、政府和其他机构的合作上发挥主导性的作用,从而以一种建立在理论和实践基础上的、全面的、能够反映各方面要求的质量观来指导排行活动。

大学、系科和学术单位内部最好在内部确定一些竞争对手,并将其业绩表现相比较。高校要想获得优秀的业绩,就必须向学术单位提供资源使之能够与其最强的对手进行比较。如果高校和学术单位都能明确地阐述使命、坦诚地公布业绩、透明地使用资源,它们在媒体开始制作并广泛发布排行榜的时候就会变得更加主动。

(三)公众的压力

虽然常有人批评排行像是促销手段一样,但是媒体以向公众公开有关信息的方式在教育领域的确发挥了积极的作用。排行的一个主要好处在于,它可以促使人们对那些影响第三级教育系统的非常重要的同时又由于缺乏开阔的视野或不愿触动某些既得利益而通常被忽视的问题进行公开讨论。上海交通大学首次发布世界大学排行榜后在法国引发的争论就是一例。当看到法国最好的大学仅排在第65位时,《世界报》立刻在2004年1月24日发表了题为《法国大学的剧痛》的文章。但出人意料的是,接受该报采访的大学校长和社会团体领袖既没有批评上海交通大学排行的基本思想,也没有批评它所采用的方法;相反,他们着重强调的是大学所面临的问题,并认为财政资源的短缺是导致法国大学系统失败的主要原因。

巴西的例子也饶有趣味。20世纪90年代中期,巴西教育部引入了一项对各大学本科教育项目质量进行比较的评价测验。在某种程度上,这种评价测验就是排行活动,因为它是根据各学校参与学生的平均分对各大学的培养项目进行排行。尽管这种“大考”是自愿的,而且也没有计入研究生的分数,但起初还是遭到众多的反对和抵制。学生们不愿参加这种测验,大学也不鼓励学生参与。尤其是在第一轮后,测验结果显示,一些高水平公立大学的得分低于预期,而有些并不知名的私立大学却获得很好的结果。然而,一段时间以后,“大考”逐渐被各方面所接受,雇主们不断要求求职者出具他们的测验结果,这也成为学生参与测验的一个非常强烈的动机。同样,在尼日利亚,当大学拨款委员会启动专业培养项目排行后,雇主开始对当地大学重拾信心,而且纷纷雇佣排名最高的工科毕业生。

六、未来之路

在全球范围内第三级教育争夺生源日益加剧的情况下,近年来各种大学排行榜的急遽涌现也就不足为奇了。政府和公众总是在异乎寻常的关注第三级教育机构的表现情况,并作为教育的消费者获得了最大限度的感知价值,第三级教育的消费者正在寻求各种指标,从而提高他们识别并进入最好学校的能力。

很多分析人士认为,由于各国的第三级教育系统在本质特征以及各国社会和文化背景上的巨大差异,开展国际性的排行是没有意义的。经费来源、治理模式、自主管理的程度、高校的使命、可靠数据的获得、可能对数据的处理等,这些都是存在变数的重要方面,同时也是对这种无意义活动的佐证。

虽然大学排行具有本质上的争议和方法上的缺陷,但它已广为流传,也不可能会消失。面对这种迅猛发展的状况,人们可能做出的反应是忽略、摒弃或抵制任何形式的排行。而较为温和的反应是努力去分析、认识排行活动的意义和局限。本文对国际排行活动的考察就是希望为政策制定者、高校领导和普通公众提供一些经验,使其更好地了解排行机制的效用。根据前文所做的论述,本文提出如下一些建议。

1.明确排行的实际目的

质量的结构具有很大的模糊性,因此,从事第三级教育排行的有关组织、政府机构和媒体应明确其排行中质量的定义。同时,它们也应详细说明想测量什么或不想测量什么、它们排行的目的以及排行结果的受用对象。根据上述信息,排行机构就可以更好地判断所选指标的合理性、可靠性和全面性,考虑所评学术工作的领域(如教学、科研等)和高校的类型。而且,排行机构还应广泛采集原始数据并实现计算过程透明化,使排行经得起各种验证。

2.运用多种指标和多重方法而非单一的加权排行

第三级教育质量的内涵是:使学生成功实现他们的理想,满足社会的期望,适应政府、工商业界的需求,符合有关专业协会确定的标准。[26]因此,排行榜应使用一系列广泛的指标,并应更加重视产出和成果方面的指标,确保在评估中涵盖质量的各个维度。多种指标会产生多个分数而不是一个总的分数,这样就可以反映出优势的领域和不足的方面。尽管高校之间的状况存在很大的差别,但各排行榜结果的矛盾和各院校间缺乏显著的差异却表明,对所有高校进行排行是毫无意义的。较为适宜的方法是像德国或澳大利亚那样对某一些或某一类高校(或培养项目),而不是对所有高校进行排行。

3.对类似的培养项目或高校进行比较

由于方法上的局限,排行对较小的比较单位更有意义。因此,培养项目的排行比高校的排行更为可取。如果一定要对高校排行的话,必须注意要对类似的高校进行比较。这意味着,不仅要从校名上去考察高校的相似性(如大学与大学、社区学院与社区学院),更要从使命、组织和培养项目侧重点上去考察高校的相似性。例如,研究型大学应与研究型大学进行比较,教学型大学应该和教学型大学进行比较。

4.高校应将排行用于战略规划和质量提升

无论是在国内或国际层面上,还是在时间维度上,为了比较而高度关注排行信息的这些第三级教育机构,实际上更应该将排行结果应用到战略思考与规划上来。这样一来就可以认清自己的优势与不足。特别需注意的是,每所大学不应把眼光局限在其总体排名上或是某个具体的排名上,而是要认真研究各个指标,从而更好地了解影响其表现的各种因素并努力改善教学和科研的质量,这才是排行对高校的真正意义所在。

5.政府应以排行来促进质量文化

在尚未建立有效评估和认证体系的国家,可以用排行来促进质量的改进。在此方面,最重要的是,要根据上文阐述的有关原则采取适当的方法。在确定方法的过程中,第三级教育机构自身的参与,对主体意识和共同目的的形成也是非常重要的。例如,1999年尼日利亚开展高校排行后,由于负责排行活动的大学拨款委员会允许大学对存在异议的标准提出批评意见并进行修订,因此,排行在实施中并没有遇到多少阻力。

6.应把排行作为向学生、家庭和雇主提供信息的工具以及激发公众辩论的工具

建立在多重指标而非单一加权方法基础上的排行,可以为新生以及寻求具有适当专业和学术资格毕业生的雇主提供有用的信息。但是,排行结果并不足以衡量最终的教育质量和适切性,排行需要辅之以认证信息以及通过雇主调查和跟踪调查采集到的劳动力市场信息共同发挥作用。最后,正如法国的例子所展现的,排行的结果也可以激发公众就第三级教育的长远战略和政策展开全国性的辩论。

标签:;  ;  ;  ;  

作为政策工具的大学排名_麦克林论文
下载Doc文档

猜你喜欢