关于我国高校排名评估的几个问题_大学论文

关于我国高校排名评估的几个问题_大学论文

对我国大学排行榜评价的几点质疑,本文主要内容关键词为:几点论文,大学排行榜论文,评价论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G640 [文献标识码]A [文章编号]1000-5951(2004)04-0099-(04)

以大学排行为基础的大学综合实力评价,有助于以此实现多种目的。通过大学排行实施综合实力评价活动,可以客观、公正、公平地反映大学各方面的状况,促进大学之间的竞争,吸引社会舆论界关注高等教育的改革与发展,引导学生择校,利于毕业生就业,引导民间的教育投资的流向,以激发大学的办学活力和科研积极性,加快我国大学向国际一流大学迈进的步伐。尽管大学排行评价具有如此多的功效,但是,大学评价毕竟是一个复杂的系统工程,在此过程中有许多问题还有待解决。

一、评价理论是否完善

教育评价是教育活动的一个重要组成部分,它是以教育目标为依据,运用有效的评价技术和手段,对教育活动的过程和结果进行评定、分析、比较,并给以价值判断的过程。教育评价学的滥觞应追溯到泰勒时期。1933年美国进步主义教育协会专门成立了以泰勒为首的教育评价委员会,开展了“8年研究”,进行了以人的发展为目标的新课程实验,设计了一套教育评价方法,这个委员会最后提出了被誉为“划时代的教育评价宣言”的史密斯—泰勒报告。这个报告标志着现代教育评价的开始。1956年美国著名心理学家布卢姆继承和发展了泰勒的教育评价理论,对认知领域的教育目标进行了分类,创立了“教育目标分类学”,强调教学与评价的统一。对教育评价理论产生了重要影响,至此教育评价理论体系已初步形成。

20世纪80年代初期,我国开始教育评价学的研究,80年代后期开始出现大学排行评价。自1987年由中国管理科学研究院科学研究所以民间形式发表第一个大学排名以来,已经先后有中国科技信息研究所、湖南大学、国家科委、广东管理科学研究院、学位与研究生教育评估所、《中国高等教育评估》杂志等13家单位的研究人员提出了30多种不同类型的大学排行榜,从不同的角度反映了中国大学各方面的情况。但是,这些大学评价的背后似乎都缺少一个科学、系统、有效的教育评价理论作为支撑。我国目前的教育评价多是借鉴和移植国外的评估理论和经验,尚未建立起自己较为完整的高等教育评价理论体系和科学的评价方法,教育评价的理论基础还比较薄弱,在当前的教育评价中还存在着一些问题亟待解决。主要表现在理论研究的力度不够,未形成理论体系,并且某些概念混乱。如把本属于教育测量学、教育统计学甚至教育测验的内容化入教育评价学;教育评价与教育评估两个相近的概念尚未给予区分,处于混用状态;教育目标、教育评价目标、教育管理目标及其关系没有进行合理界定;教育评价指标与教育评价标准概念相互干扰;教育评价主体与教育价值主体、教育评价客体与教育价值客体概念区分不清;定性与定量再教育评价中的表现没有详细探讨,模糊教育评价的限度,教育评价学处于无能为力的教育评价学研究领域。[1]无庸置疑,系统、科学的评价理论是确保评价结果准确有效的前提,而缺乏先进理念和理论支撑的大学排行实践必然让人深感忧虑。

二、评价主体是否客观

实施大学排行乃是从大学发展水平和办学质量角度对大学进行的一种客观性评价,从本质上讲,就是对大学进行一种价值判断。价值判断是评价主体根据价值主体的需要,衡量价值客体是否满足价值主体的需要以及在多大程度上满足价值主体需要的一种判断。鉴于价值判断所具有的复杂性、不确定性和非普遍性的特征,评价主体视角的不同以及操作过程中的不可重复性,在指标的设定及其权重的分配上各有选择和侧重,必然导致不同评价主体所得出的大学排行的评价结果有所不同。这正是人们对事实判断的科学性确信无疑,而对基于价值判断的大学排行的科学性持有怀疑态度的根源所在。在实施大学评价时,必须依据一定的制度或规则,“制度是一系列被制定出来的规则、守法程序和行为的道德伦理规范,它旨在约束追求主体福利或效用的最大化利益的个人行为。”[2]有效的制度或规则是保证大学排行科学性的前提。因为“制度是社会的博弈规则,或者更严格地说是人类设计的制约人们相互行为的约束条件,用经济学的术语说,制度是定义和限制个人的决策的集合。”[3]利用大学排行榜对高等教育实施评估就是不同相关利益群体的博弈过程。由于博弈参与人的效用目标和行为能力的不同,在制度博弈的过程中,参与人的行为选择依赖于其他人的行为,评价制度的形成依赖于参与各方的资料掌握情况和博弈能力,而博弈的结果就是参与人之间博弈的动态平衡。目前,由于各种复杂的原因,急功近利、追求短期效益已成为一种社会的弊病,在某种意义上,大学评价过程不再是纯粹意义上的教育实力较量,而是相关利益群体的名誉之争,在这种功利思想的影响下有可能使参与博弈者破坏大学排行评价过程中的“游戏规则”。

在大学评价制度目标的实现过程中,由于人类理性的有限性、信息的不完全性以及制度环境的复杂多变性,其结果是不同评价主体对同一对象的评价往往得出不一致的结果。教育作为一种复杂的社会活动,既呈现出精神形态的创造性,又具有价值追求的多样性,教育的品质更多地体现在非直观的理想层面和价值世界,试图仅用可见的物化和量化指标来解释、评价教育的要义和实力,显然有失偏颇。教育的发展离不开学校特色的彰显和个性教育的张扬,“个性”“特色”“品牌”既是宝贵的教育资源,又是最具价值的追求目标。[4]为了追求大学排行的公正或公平,大学排行评价实行的多是世界统一或国家统一的指标体系,而且多是规范化、共性化的直观量化指标。然而,这些看似“规范”、“共性”的量化指标,因为过于琐碎或细化,不但不能表达评价主体对学校的看法,而且会扭曲和限制大学固有的本质,其结果不仅会在客观公正的“外衣”下将评价主体真正的客观性扼杀,而且会将那些富有特色的大学排除在外,诱导其他大学追求统一的办学模式,带来大学发展的“千校一面”。

再就是,评价主体样本取样过小无法做到大学评价的客观、全面。例如,网大2000年大学排行评价指标体系的确定是向具有代表性的115位专家发放问卷,而最后只有52位专家愿意参与,回复率只有45%。该网站在进行1999年大学排行评价的数据调查和收集时向601位中国科学院院士、260所有互联网址的大学及其校长发去了调查问卷和调查表。总共收到218名院士、47名大学校长和数十所大学的回答。回答的院士中包括数理学部院士32名、技术学部院士68名、生物学部院士37名、化学学部院士47名、地质学部院士34名。院士的回复率为36.3%,而大学校长的回复率仅为18.1%。[5]从以上取样我们可以看出,他们仅从教育“精英”和具有网址的大学校长中进行取样,这样会带来评价视角的褊狭,而不能全方位、多角度对大学实施评价,这一点就不足以代表社会的需要和广大教育者的共识。因为大学排行是一种社会评价,评价的主体是社会,社会的需要是建立评价体系的价值基础。而我国现有的大学排行评价多数忽略了这个问题,更多从自己对大学质量的认识出发,将评价主体作为价值主体,因而在设计排行评价的方案和指标体系时往往将个人的价值标准代替组织和社会的价值标准,这种价值基础上形成的评价指标缺乏可靠性。而且,在取样不合理的情况下,数值较低的回复率也表明了它不具有广泛性和权威性。这种建立在小样本取样调查基础上的指标体系和相关数据,其信度和效度也是令人难以信服的。

三、评价客体是否同质

大学排行评价是将一所大学分解为若干指标,逐项评定,取其总分,以此为依据进行排名。在此,比较的关键是大学具有多少同质性,也就是说大学之间具有多少可比性。“同质性是可比性的前提,同质就是学科相同,同质性比较就是相同学科之间进行比较。不同质就是大学类型不同,学校整体不同,但可以分解出相同的学科,从不同类型大学的相同学科中获取的信息是符合同质性、可比性和完整性等评估的基本要求的。”[6]其基本假设是:大学存在所谓的“综合实力”,而且不同方面的“实力”及不同类型、层次的大学的“实力”是同质的或可转换为同质的,也就是可测量的。但是,这种基本假设是否合理?如果不合理的话,这种比较是否还具有原初的意义?

从宏观上讲,高等学校的综合实力的构成可分为硬实力和软实力两个方面,学校实力的真实体现是两者协同作用的结果。硬实力表现为有关物质形态的构成因素的全体,主要包括人(教师资源、学生情况等)、财(经济状况)、物(固定资产)等可测量的硬性指标;软实力表示非物质形态构成因素的全体,指有关学校管理水平(办学活力和办学效益)和办学特色(办学传统和社会声望)以及校风、凝聚力等不可测量或难以量化的软指标。[7]实际上,一所学校在学术界和教育界的地位和角色并不是与这个学校的硬实力成正比的,因为学校实力是硬实力与软实力的有机结合。根据系统论的原理和学校教育的发展规律可知,学校的综合实力受到学校系统的组成、机构以及内外部环境的影响。一个学校要获得最佳的发展效果必须在学校各部门协调配合的同时,考虑与社会环境的联系,使高校适应社会的动态发展,在动态发展中求得最佳平衡。如果学校内部要素、机构等与外界环境不协调,必然导致学校功能的紊乱、效益低下,影响学校综合实力。因为各个子系统最大功能的发挥并不代表学校大系统整体功能的最好发挥。“根据系统工程的原理,局部的优化不等于整体的优化。一所大学作为一个系统,可能由于各子系统的和谐运转而使整个系统处于最佳状态,发挥最大功能;也可能由于各子系统的相互矛盾使整个系统处于不良状态。当然,如果不是对一所大学进行评价,只是就一个项目,如生均经费、生均仪器设备、师生比例等教育资源进行比较,排行榜可能有一定价值,但作为对一所院校的整体评价则价值不大。”[8]可见,对大学的某些指标进行量化加权处理后的所谓评价结果,并不能确切代表一所大学的综合实力,并不能反映该大学的真实水平。

四、评价数据是否准确

教育评估本身就是在系统收集信息的基础上,对教育活动作出价值判断的过程。因此,准确、有效地收集数据是实施大学评价的前提和关键,没有准确的信息作为事实基础,任何教育评价都是难以令人信服的。大学排行,作为教育评价的一种手段,其主要贡献或许就在于:把有关大学的数据资料集中起来,分门别类地进行比较,帮助各大学对自身的办学水平和办学状况进行比较与反思,从而找出差距,扬长避短,促进自己学校整体办学水平的提高,并能帮助人们较为清晰地对大学实力和水平有所了解与认定。

国际著名的几家大学评价,如《美国新闻与世界报道》的大学排行榜、《麦克林》新闻周刊的加拿大大学排行以及英国《泰晤士报·高等教育副刊》的优秀大学指南等,数据的收集基本上通过以下三个途径:通过问卷调查由各个学院自己提供的有关统计资料;大学及其教育相关的各项机构每年公开的年度统计报告;针对教育界及用人单位进行声誉调查的结果。[9]其中前两个来源属于客观性数据,最后一个属于主观性数据。为了保证数据的可靠性与准确性,排行评估者往往专门委派人员对收集来的原始资料和数据进行调查分析后,再交给各大学请他们自己审核。由于资料来源的可靠性和使用的谨慎,上述大学排行榜不仅对本国高等教育的发展起了积极作用,而且引起了世界高等教育界的关注。与此形成鲜明对比的是,《亚洲新闻周刊》的“亚洲最佳大学排行榜”,因为仅仅依赖由各大学自己提供的相关数据信息和同行专家的声誉调查,最后导致许多著名大学名落孙山。当然,这一方面是由于许多著名大学对大学排行不感兴趣而未提供详细资料,而更重要的恐怕在于评价过程中数据的不准确所致。

众所周知,当前我国社会信息透明度还比较低,与大学排行有关的信息甚至还严格保密,这就为排行信息的收集带来了很多困难,尤其是民间机构作为大学排行的组织者和实施者,更是加剧了这一困难。在进行数据的收集和统计过程中,可能会在实际的运作中遇到数据不能支持而难以操作的问题;对于一些没有客观数据的指标,鉴于调查方式存在的困难以及可能产生的随意性,常常处于缺省状态;对于数据的来源和测算方法没有公开,无法接受公众的检验并吸收各有关方面提出的合理意见。在此情况下,更多的大学排行只好将指标简单化,选取容易取得的间接资料,而获取数据的局限性使误差不断放大。

五、评价方法是否科学

尽管在确定评价指标体系时应尽量使用易得的确切数据,但由于高等学校是一个复杂的系统,而高等教育的性质和规律决定了一所大学核心的部分往往是管理水平和办学特色以及校风、凝聚力等软指标,在教育界和学术界扮演的角色也往往是由它们决定的。而这些软指标不可测量或难以量化,只能概括地定性描述。由于一所大学的综合实力是软、硬因素协同作用的结果,因而对大学评价时定性指标和定量指标同样重要。定性排行一般通过声誉调查的方法实现,主要通过对有关人士调查的结果进行数量化分析,排出大学的名次;定量排行则是完全建立在各大学统计数据的基础上,根据一定的指标和权重,算出所有大学的得分,根据其得分排出名次;定性与定量相结合是定性排行与定量排行的结合,通过把定性排行的结果赋予一定的权重,从而将其纳入到定量排行的体系中,得出一个总括性的结果,这是一种为多数人接受的方法。但定性排行在总体排行中的权重及其操作规程还有待完善。

在大学排行中的一个重要问题是如何处理好数量与质量以及教学与科研的关系。尽管没有数量,质量将无从谈起,但只追求数量而忽视质量就不能真实反映出一个学校的水平和实力。对于大学来说,质量指标或许是更不可缺少的,因为质量是大学的生命线。目前大学排行中存在的按绝对数量计算的“重数轻质”的倾向,极易诱导大学在扩大规模上做文章而放松教育质量的提高。因为目前大学排行多是科研的数量作为排行的最主要依据,而忽略了大学中更为重要的一极,即教学功能的体现;或者说,科研指标的权重比较大,而教学质量方面的指标则很少。其实由于科研活动难以精确测量,科研指标在国外多种大学评价中并没有直接出现,而是以学术声誉、人均经费等间接反映,这正是科研水平和实力的重要反映。但是在我国大学排行中,主要以一个学校的科研实力的量化计算来体现其所谓的实力,按照以科研为主的指标体系进行简单加权排出的只是计量指标排序,而不是真正意义上的大学排序。这对于一些非研究型大学来说,显然有失公允。而且,我国现有大学排行评价在科研指标中存在着重理轻文的现象,这对于以文科为主的学校来说无疑是雪上加霜。一个典型的例证是:在网大的排行中,文科院校不敌理工科院校,其中一个重要原因是评估中有一项指标是物质资源的评估,主要是依据人均科研费用的高低来确定。鉴于理工科院校在国家与社会中所发挥作用的重要性以及长期以来国家与政府扶持力度的倾斜性,国家分配或横向课题拨给理工科的经费肯定大大高于人文学科,不同等的教育经费必然会导致科研成果数量的差别。还有,自然科学作为一种没有国界的学科,比较容易在国际期刊上发表文章,而社会科学由于受到意识形态和文化习俗的限制,很难在国际刊物上发表文章,而学校间论文的评比多以在国际上发表的论文数量为依据,从而造成了文科院校在大学排行中难以跻身前列的事实。更富有戏剧性的是,在深圳网大排行榜上名列第9位的中国人民大学,却只能屈居《2002中国大学100强》的第44位。对于一个老牌、名牌大学来讲,这种匪夷所思的悬殊差别,岂是指标体系不同、数据采集渠道不同以及排名各有侧重所能解释的?

笔者并不完全反对搞大学学术排行榜,也不反对民间机构参与这项工作。但是,对于高等学校的办学水平和学术声誉进行评价是一项严肃的工作,它关系到大学的发展定位以及大学在公众心目中的形象,它至少需要严谨的科学态度、合理的评估指标体系、准确有效的评价数据、科学的评估程序与方法。在进行硬件评定的时候,还要对学校进行多方面的深入细致的考察,以有效将学校的软件进行加权,并在此过程中平衡数量与质量、定性与定量、教学与科研的关系,从而保证大学评价排行的信度和效度。如果不具备这些条件,仅凭一些小样调查和少数几个指标,采取简单量化打分的方法对高校进行综合排名,其结果就很难作到科学、公平、公正。在目前大学评价体系尚不成熟、大学评估和排序的“游戏规则”尚不健全的情况下,大学排行虽然可以搞,但要避免商业炒作之嫌,应先限制在学术交流的探讨之列,不宜大张旗鼓地推向社会,以避免引起误导。

标签:;  ;  ;  

关于我国高校排名评估的几个问题_大学论文
下载Doc文档

猜你喜欢