对我国大学排行实践的回顾与思考,本文主要内容关键词为:我国论文,大学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G640 文献标识码:A 文章编号:1001-4519(2002)04-0090-06
1987年9月13日,《科技日报》以《我国科学计量指标的排序》为标题,公布了中国管理科学研究院科学学研究所以《科学引文索引》(SCI)数据为指标对我国87所重点大学的排序。这是我国学者第一次对我国大学进行排行研究和探索。90年代开始,随着国家一系列鼓励对高等学校实施监督、对办学质量进行检查的文件的出台,我国的大学排行实践进入了蓬勃发展时期。有学者统计,截至2000年底,我国先后共有13家单位发布了30个大学排行榜。暂不论这一统计是否全面、准确,从某种程度上说,这些大学排行榜代表了我国大学排行实践的基本情况、主要特点和发展趋势,并隐含了诸多值得我们深入思考的问题。
一、我国大学排行实践的基本特点和趋势
回顾我国十多年来大学排行评估的实践历程,早期多以科研成果排行为主,集中在自然科学、理工类专业,完全依据公开的客观数据,排行评估的指标、排行评估的主体、排行结果的发布途径相对单一。随着高校排行评估实践的不断深入和改进,现今的高校排行评估大致呈现出以下几个方面的主要特点:开始尝试综合排名,自然科学与社会科学(文理)并重,增加了主观的价值判断成分,指标渐成体系,排行评估的主体、排行结果的发布途径走向多元,研究生教育开始被作为单列项目进行排行。
1.以科研成果排行为主过渡到开始尝试综合排名
在上述30个中国大学排行榜中,半数以上都是完全或主要针对各高等学校的科研成果而进行排行的结果。因为这些排行的主要数据源基本上是国内外的各种科技统计资料汇编。如美国费城科学情报研究所公布的《科学引文索引》(SCI),美国工程索引公司的《工程索引》(EI),国家教委科技司编的相应年度的《高等学校科技统计资料汇编》,社科司编的《全国高等学校社科统计资料汇编》,以及《中国科学引文数据库》(CSCD)、《中文社会科学引文数据库》(CSSCI)等。而这些排行结果本身也冠用了足以反映其重在科研成果排行的名称,如:《用科学指标评估高等科研水平》、《中国科技论文统计和分析简报》、《中国大学评价——研究与发展》、《高校科技实力排行》等。
90年代中期以前所发布的所有大学排行榜,无一例外都是高校科研成果排行榜。90年代中期以后,开始有个别的综合排行榜面世。世纪之交,出现了几个有一定影响的综合性大学排行榜。如:莱比格信息技术(深圳)有限公司在《中国青年报》、netbig.com网站发表、公布的1999、2000年度中国大学排行榜,广东管理科学研究院武书连等在《科学学与科学技术管理》杂志及utop.com网站上发布的《中国大学评价——1998》等。
2.以理工类为主过渡到文理并重
从学科门类的划分情况看,以科研成果为主的早期中国大学排行明显集中在理工科专业。其中所谓的科技活动基本都属于自然科学领域,其排行的主要依据是《科学引文索引》、《工程索引》以及《高等学校科技统计资料汇编》等。
1993年,广东管理科学研究院的武书连等人在推出《中国大学评价——1991研究与发展》排行结果时,引入了国家教委社科司编的《1991年全国高等学校社科统计资料汇编》作为数据源,首次推出了包括哲学、人文科学和社会科学活动等在内的中国大学排行。这标志着社会科学或者说文科开始被作为大学排行评估的要素。2000年6月,南京大学邹志任教授领衔创建的《中文社会科学引文数据库》问世,相信将在中国大学排行评估中对强化文科要素起到举足轻重的作用。
3.由完全依据客观数据过渡到加入主观的价值判断
早期的中国大学排行评估基本上完全依据公开的客观数据,如被SCI和EI收录的科技论文数,或《高等学校科技统计资料汇编》中国外及全国刊物论文、专利批准及国家级奖的数目等,所有数据未作任何处理,基本照实抄录。
1992年4月,湖南大学张英等发表的《全国86所重点高校1985-1989年科技活动评价》,首次对不同成果采用了不同的权重。1993年,武书连等人运用特尔斐法,根据全国203位专家给定的权重作为其大学排行的各项指标的权系数。1998年4月,中南大学蔡言厚教授采用比重法排出了中国大学培养高层次人才的综合实力前100名。1999年7月,莱比格信息技术(深圳)有限公司引入了学术声誉和专家评分等指标,有200多名学者和企业家参加了其大学排行榜的大学学术声誉调查。
无可否认,对各项指标赋予不同的权重,采用比重法,进行学术声誉调查等,与单纯列出各大学发表的论文数、被引用次数等公开的客观数据相比,在不同程度上加入了评价者或评价参与者的主观价值判断要素。
4.排行指标渐成体系
1987年,我国第一份大学排行榜只有一项指标。1989年,《我国重点高等院校科学计量多项指标排序及其分析》选用了三项指标。1993年,武书连等人的大学排行涉及25项指标,1997年增至42项指标,2000年共计23项指标。莱比格信息技术(深圳)有限公司的大学排行,1999年为6项指标,2000年增加到17项。
在指标项目增加的同时,根据专家的建议和排行的实际需要,经过反复论证和多次修订,各大学排行所选用的指标都已渐成体系。如《中国大学评价——1998》,以各大学对社会的贡献作为排名的唯一衡量标准,根据高校从事教学的专任教师折合人数和研究与发展全时人员的比例,确定了人才培养和科学研究两项一级指标及其权重,进而根据一级指标的主要产出项确定了23项二级指标。
5.排行评估的主体、排行结果的发布途径开始由单一走向多元
我国最早对国内大学进行排行评估的是中国管理科学研究院科学学研究所。1987年至1989年,科学学所先后推出了三个大学排行榜。90年代开始,中国科技信息研究所、湖南大学、广东管理科学研究院、学位与研究生教育评估所、中南大学、莱比格信息技术(深圳)有限公司、北京思路科技网开发有限公司等机构,也相继推出了各自的大学排行结果。尤其是90年代中后期以来,每年都有数个中国大学排行榜问世。以2000年为例:6月7日,由教育部科技司授权、教育部科技发展中心提供独家数据的北京思路科技网开发有限公司,发布《2000中国高校排行榜》;6月8日,《中国青年报》和香港网大(中国)有限公司在人民大会堂联合发布《2000年大学排行榜》;7月,广东管理科学研究院武书连、吕嘉、郭石林在《科学学与科学技术管理》杂志2000年第7期发表《中国大学评价——1998》。
评估主体由单一走向多元的同时,排行结果的发布途径也演绎出某种类似的轨迹。早期的大学排名大多都是发布在报纸、期刊杂志等印刷媒体上的,如《科技日报》、《光明日报》、《中国科技期刊研究》、《科学学与科学技术管理》等。到90年代末期,大学排行榜除继续在《科学学与科学技术管理》、《中国高等教育评估》、《中国青年报》等相对固定的新闻性和学术性印刷媒体上发布之外,作为信息时代主要产物的网络也开始成为大学排行榜发布的重要阵地。其中较主要的网站如:netbig.com、uniranks.edu.cn、utop.com等等。
6.研究生教育开始被作为单列项目进行排行
1995年底公布的《'94中国研究生院排行榜》,是学位与研究生教育评估所接受国家教委的委托、对全国33所试办研究生院进行评估排行的结果。该排行评估包括研究生培养与质量、学科建设及成果、研究生院机构建设等三方面的内容。以此为标志,研究生教育的排行评估作为单列项目,开始成为中国大学排行评估的重要组成部分。
1998年4月,蔡言厚教授发表论文《我国高校培养高层次人才的综合实力比较》,根据各大学博士点、博士后流动站、国家重点学科(含国家重点实验室、国家工程/技术研究中心、国家文科基地)情况,采用比重法排出了中国大学培养高层次人才的综合实力前100名。
2000年7月,广东管理科学研究院从学生接受最好教育的角度评价大学,从大学排行中选取与研究生培养和科学研究有关的指标,并将评估对象确定为全国已经培养出了博士的大学,得出了包含有187所大学的1998年中国大学研究生院(含不设研究生院的大学研究生处、研究生办公室)排行榜。
二、对我国大学排行实践几个基本问题的思考
经过十多年的探索和改进,我国的大学排行评估实践正日益充实与完善。尤其自90年代中期以来,大学排行评估的实践者在推出排行榜的同时,也对一些与排行评估有关的基本问题进行了不同程度的理论探讨。其中较典型的如学位与研究生教育评估所在发布《'94中国研究生院评估排行榜》时,还发表了题为《我国普通高校研究生院评估指标体系》的理论探讨文章,对排行评估所采用的指标体系(包括指标的选择及其权重的确定)和部分评估方法进行了解释说明。再如广东管理科学研究院的武书连等人在先后推出的五份大学排行榜中,都配发了大篇幅的说明性文字,对排行所依据的理论基础与科学假设、所采用的主要方法、指标体系的构建、排行榜的构成与特色等加以解释,并在某些问题上取得了一些突破。如试图以“不同类型大学的科研人员平均具有相同的创新能力”和“不同类型大学的科研人员平均具有相同的获取科研经费能力”的假设为基础,为解决长期困扰国内高等教育评估学者的不同类型大学的相互比较问题。更重要的是,这些理论的假设和探索引发了诸多争议,某些商榷文章对有关大学排行的理论问题进行了更加广泛或深入的探讨,从而为大学排行的实践提供了更有针对性的理论指导。最近,有学者对与大学排行有关的研究文章进行检索,收集到13篇针对中国大学排行实践的理论争鸣类论文,其中10篇针对武书连等人所进行的大学排行。
下面,笔者将围绕上述的大学排行实践的一些基本特点和趋势,针对其中某些基础性的问题,从比较的角度阐释个人的一些想法。
1.为什么要开展大学排行
提到大学排行,无论如何都绕不过《美国新闻与世界报道》的美国高校排行榜。其在排行说明中这样表述排行的直接目的:“学院和大学的生活经历将会改变学生以后的人生道路,他们对学院和大学了解得越多,在选择就读那所学校时就会更加自信。”排行就是“为使学生及其家长明智地选择所要就读的学院”提供尽可能全面、丰富的信息。这种比较典型的“消费者导向”排行,以“消费者”的需要为确定指标体系的基础,赋予了学校声誉、学生保持率以及附加值等可以用来衡量学院对学生的教育效果,即学院所提供的教育质量的指标给予较高的权重。加拿大《麦克林》新闻周刊的大学排行则明示“是为学生选择学校而设计的”,“每个学生都有权在了解有关情况之后再做出明智的选择。”因此,其所选取的6个方面22项指标仅涉及学生、课堂、教师、财务、图书馆及学校声誉等择校学生最想了解的情况。
当然,就排行榜的客观效果来说,除为学生选择大学提供参考、起到一定的导向作用外,还可以激励社会人士批评和关注高等教育,帮助高校获得道义和物质上的支持,从而产生影响世人的广告效应。如《美国新闻与世界报道》的美国高校排行榜,在影响着美国年轻学生及其家长的择校意向的同时,还影响着美国企业对产学合作伙伴的选择以及非营利机构的资金流向,影响着美国政府的教育决策与拨款。
与之形成鲜明对比的是,国内的大学排行榜中,只有学位与研究生教育评估所在对中国普通高等学校研究生院进行评估排行时,明确指出其目的是“检验试办研究生院十年来的成果;总结研究生院建设和学位与研究生教育的先进经验;促进中国学位与研究生教育的改革与发展;发现问题,改进工作,提高研究生院建设的水平与效益。”再就是,武书连等人的《中国大学评价——1998研究生院》提出“可供应届高中毕业生报考大学和迎接大学毕业生报考研究生参考”。其他排行的目的性似乎都不太明确,至少未曾明确说明。仅仅寄希望于“随着社会的认同和国人认识水平的提高,中国的大学排行榜最终会起到引导学生择校、引导民间的教育投资流向、促进大学竞争、吸引国人关注高等教育的作用,即起到推动中国高等教育发展乃至中国社会发展的作用”,无疑有失笼统。更何况,在我国当前情况下,出现在各类大学排行榜上的大学数量,仅约为全国高校总数的3-20%。因此,所谓的中国大学排行实际上只是相对意义上的“最佳大学”排行而已,并没有给人们提供有关为数众多的“非优秀大学”的任何信息。因此,我们禁不住要问:这样的大学排行能够对占总数80%乃至更多的中国高校产生多少直接或间接的影响呢?
2.大学排行实质上是一种比较性评估
顾名思义,大学排行就是要为大学排出一个顺序,确定每所大学在排行榜中的位次。因此,排行榜所提供的应该是进入排行榜的各大学的相对性的比较信息,大学排行实质上是一种比较性评估。既然是比较,就不得不考虑评估对象的可比性,即比较对象是否同质,哪些是可以比较的,哪些是根本不能相提并论的。这在单项性的排行中,问题尚不突出。但涉及到综合性的大学排行时,不同类型的大学之间如何进行比较往往成为困扰评估者的难题。尽管学位与研究生教育评估所、广东管理科学研究院等机构的评估人员在这方面付出了不少努力,但仍不足以平息人们的争议,消除大家的分歧,相反还引发了一些新的责难。
放眼国外的综合性大学排行,基本上都是建立在为公众所认可的大学分类基础上的,所谓的综合性排行也只不过是对同类大学的综合性比较而已。如《美国新闻与世界报道》的最佳学院排行榜,就是依据卡内基教学促进基金会公布的高等学校分类法,把经过美国教育委员会组成的权威性评估机构鉴定认可的十四类大学和四年制学院(主要是提供本科和研究生教育的机构)划分成全国性大学、全国性文理学院、地区性大学和地区性文理学院四大类,分别进行评估、排行。加拿大的《麦克林》新闻周刊则依据研究经费、专业的多样性及哲学博士学位所涉及的领域,把大学分为设有医学院和有博士学位授予权的大学、综合性大学、主要招收本科生的大学三类。“经过这样分类后,同组内的大学就具有了相似的结构和指标,也具有了可比性。”
我国的综合性大学排行却未对不同使命和目标的高等学校进行分类就试图建立综合性排行榜。事实上,绞尽脑汁地寻求某种所谓的“科学假设”或“事实依据”从而对本来根本就不具有多少可比性的不同类型高校进行综合排行,并未达到“使排名结果更具有公信力”的初衷。因为当今社会对大学的需求是多元化的,而这种多元化的需求靠单一类型与层次的大学是难以满足的。而不同类型与层次的大学由于其所承担的任务与培养目标的不同,在办学的特色、方向和文化背景等方面存在着较大的差异。因而用同样的指标体系衡量不同类型与层次的大学显然是不科学的。举个简单的例子:在我们用“科学引文索引”这一指标对大学的科研水平进行排行时,理工类大学与艺术类院校是否处于同一水平线上?
到目前为止,我国仍然没有权威的大学分类方法。通常所采纳的按科类分成综合、工科、师范、医药、农业、林业、财经、政法、民族、语言、体育、艺术院校的做法,是与1952年院系调整后各类专门学院为主体的高等教育体制相适应的,已远远不能适应当今学科交叉融合的发展趋势。在这种情况下,大学排行有两条道路可以选择:第一,继续开展大学综合排行的实践探索,并尝试建立自己的分类标准,在将大学适当分类的基础上进行排行,并将分类标准与排行榜一起发布;第二,暂且回避院校整体评估排行,而着力就大学的某一侧面或某一学科,或根据不同的目的进行分项排行,如在一级学科的框架内开展排行评估。然后,在各分项排行评估逐步成熟的基础上,向综合的院校整体排行性评估过渡。
3.准确可靠的数据资料是大学排行评估的基础支撑
教育评估本身就是在系统收集信息的基础上,对教育活动做出价值判断的过程。因此,信息的收集是教育评估的基础性工作。没有准确、有效的信息,任何教育评估都是不可靠的。大学排行,作为教育评估的一种类型,其主要贡献或许就在于:把有关各大学的数据资料集中起来,分门别类地放在一起,并赋予其一定的意义,使那些对大学之间的差异感兴趣的人们更容易地得到、理解和使用。
国际著名的几项大学排行评估,如《美国新闻与世界报道》的最佳学院排行榜,《麦克林》新闻周刊的加拿大大学排行,以及英国《泰晤士报·高等教育副刊》的优秀大学指南等,数据的收集基本通过以下三条途径:通过问卷调查由各个院校自己提供的有关统计资料;大学及与教育有关的各机构每年公开的年度统计报告;针对教育界及用人单位进行声誉调查的结果。其中,前两项属于客观数据,第三项属于主观性数据。尽管这些国家的教育行政管理部门设有强有力的统计机构,以通讯形式定期发表重要数据统计供人们自由索取,同时也出版详尽的统计报告,但为防止某一来源的数据发生差错或纰漏,美国的排行评估者往往委派专门人员对不同来源的数据信息进行对照,根据一定的原则进行补充和修正;加拿大的排行评估者则在正式使用相关数据前,要征求学校的确认和肯定;英国的排行评估者是在对从各方面收集来的原始资料和数据进行初评之后,把初评得分交给各大学请他们自我核实。由于其资料来源的可靠性和使用时的谨慎,上述三个国家的大学排行榜不仅对本国高等教育的发展产生了很大的促进作用,也引起了世界各国的关注,成为人们了解这些国家的高等教育概况的重要途径。与之形成鲜明对比的是,《亚洲新闻周刊》的“亚洲最佳大学排行榜”,仅仅依赖由各大学自己提供相关数据信息和同行专家的声誉调查,最后使许多著名的大学因为未提供资料而名落孙山。这样的排行结果,又有多少公允性和可信度呢?
回顾我国十五年来的大学排行实践,之所以会呈现这样的一种发展态势,在很大程度上是由信息数据资料方面的客观情况所决定的。
众所周知,长久以来,我国社会信息的透明度非常低,客观上为大学排行的信息收集带来了重重困难。但随着我国高等教育改革的不断深入,高校信息系统的建设得到迅速加强:教育部设计建立了《普通高等学校基本工作状态数据库》,为建立健全高校的基层信息档案,逐步向规范化、数据库化、计算机网络化发展起到了良好的示范作用。这些基础性工作的开展,将使大学排行评估者有可能得到客观可靠、规范统一的高等学校信息资料,减少各项评估分别采集数据的基础性工作量,避免数据的重复统计和指标界定口径的不规范,从而有效地提高大学排行评估的信度与效度。