学术评价的制度环境分析,本文主要内容关键词为:学术论文,评价论文,制度论文,环境论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
上世纪90年代以来,研究学术评价问题的文献如汗牛充栋,但是鲜有规范的学理分析。本文尝试在制度经济学的分析框架里阐述学术评价制度的约束条件。本文第一部分是文献回顾,第二部分分析学术评价权的决定,第三部分试图大略理解我国现有的学术评价制度。
一、学术评价相关文献回顾
国内外对“学术评价制度”问题的分析总体上并不多,并且比较侧重于单项制度的描述与评价。从研究类型上看,经验实证分析比较多,原理分析比较少。从内容上看,主要包含对量化评价方式的描述与评论,杂志审稿专家的分析,学术腐败问题的描述与评论,基于CSSCI与SCI等系统指标的学科分析,等等。从国际国内比较看,国外的研究主要侧重于微观实证分析,国内的研究相对比较笼统,描述性风格较强,但近年来也有借鉴国外研究方法的趋势。
对学者的学术作品进行评价,在文献计量学产生之前,这类评价一般是非量化式的对学术作品质量① 直接品评而得出结论。上世纪50年代之后,随着文献计量学的产生与发展,SCI、SSCI等检索系统的建立与完善,量化评价方法得到了广泛应用与不同程度的认同。所谓量化评价,一般是根据作品发表的杂志的影响力、作品被引用的次数等指标综合计算得出相对排序结果。
非量化评价方式由来已久,即使在文献计量学产生之后,仍然被国外的许多大学以及老一辈名家所推崇。极端的例子,就是凭着学者的谈话来决定取舍(张五常,2001)。我国在上世纪二三十年代基本上是学习国外的模式,建国以后,基本上是将(学术成果)数量与非量化的同行评议结合起来进行评价。这种方法比较看重成果的数量,对于质量的判断,由同行评议来进行补充。有学者认为这种方法虽易于操作,但有先天不足,虽有量的规定但无质的要求或虽有质的要求也难以贯彻(杨守建,2001)。由于其在数量上的要求容易造成低水平作品的泛滥,质量上的同行评议也容易被人情关系所左右(曾冬梅,1998),因此自上世纪90年代以来,这类方式越来越受到人们的批评与抛弃,根据作品所发表杂志的级别、著作的字数与作者排序等情况量化评价的方法逐渐被人们所采用,至今已经实行了十余年。随着这项制度在实践中给人们带来的冲击,各类矛盾与不良后果逐渐凸显,又纷纷遭到了人们的批评。有学者指出,这样的评价方法带有浓重的行政色彩,学术活动的价值以其被认同的有关行政部门的级别为指向,并且主观随意性很强(刘明,2004;蔡毅,2003;李存娜,2004;等等),光凭行政官员自身的知识,不可能制定出一个科学合理、波及所有专业的期刊排名(刘绪贻,2000)。因此有些学者提出应根据成果的被引用率指标来评判其价值,因为学术论文有其一定的影响周期,论文影响周期越长,说明它的生命力越旺盛,其价值越高(阮全贵、高永东,1997,张聪、张磊,2004,等等)。
从本世纪以来,人们的注意力逐渐转移到引用率指标评价方法上来。这一方法在国外已经实行了几十年,有一套比较成熟公认的排序方法,但在我国,才刚起步。《高校人文社科核心期刊总览》(北京大学中国高校人文社会科学文献中心编)、《中文社会科学引文索引》(南京大学中国社会科学研究评价中心编)、《中国人文社会科学核心期刊要览》(中国社科院文献信息中心文献计量学研究室编)、《中国学术期刊综合评价梯度报告(CAJCEHR)》(中国学术期刊(光盘版)编辑委员会发布)等文献的编辑出版,为这一方法的实施创造了良好的条件。但在具体操作上,仍然不尽合理,有些指标计算比较简单化,数据动态更新速度也过慢。因此现有的文献在大加推崇的同时,也提出了不少完善意见。与此相对照,国外对这一方法的看法却存在很大分歧。美国的计量学派认为根据引用率的量化评价方式比较准确、客观,具有可比性,有较大优势;但也有一些机构和个人认为量化评价方式太重视引用率,而引用的性质各不相同,即缺乏一个合适的关于引证标准的定义,并且不同学科也有不可比性(E.Garfield,1972)。根据引用率计算的相对排序,只能说明相对影响力,并不能对作品的质量作实质的界定(Clive Beed and Cara Beed,1996)。
总结这些文献,可以发现关于学术评价系统的具体的研究比较多,对学术评价的描述性批评比较多,但是规范的学理分析较少。
二、学术评价中的产权安排
1.评价目标
学术指的是创造知识或以一种新的方式使用现有的知识解决疑难、回答问题。它以圈内有能力判断成果的价值和质量的广泛交流和证实作为评价的基础。学术的种类有:发现、综合、应用和教学(转引自:刘剑虹、吕杰,2002)。因此学术包括人们从事知识生产活动的目标即最终知识,生产这种知识的方法、原则(作为另一种知识存在),生产知识的人即学者的一些特征及其生产知识的活动,学者生产知识的能力。因此,学术评价可以是指对学者生产的单项学术作品的评价,也可以是指对学者的总体学术贡献的评价,或者对学者的知识生产能力的评价,以及对学者从事与知识生产相关的活动(应用与教学)的能力与贡献的评价。所有这些评价,都与知识生产者即学者有关,也与评价者有关。
2.公共物品与学术作品的度量
学术评价依靠对学者的学术(能力、贡献等)进行评价,从而确立其获得相应报酬的权利,以及学者凭借评价所获得的声誉,确立其获得其他报酬的权利。学者因为他人对其学术上的评价而获得货币收入与声誉,可以正向激励其从事学术活动,这是本文的假定之一。为分析方便,本文也以学术作品指代学术。
我们知道,一般商品参与市场交易时,是人们之间对该商品权利的交换;对商品的产权是指对特定品质的商品的产权,因此面临着对商品品质的度量问题。对一般商品品质的度量有多种方法,但通常以卖者宣称的品质为标准,买者或者自己亲自检验,或者由国家强制保障买者获得的承诺。与一般商品交易不同的是,学术作品的初始著作权天生地由生产它的作者本人所拥有;作者所依凭的著作权,除了作为一般商品面向市场出版或出售并获得报酬,通常大多数学术作品并不能因此而获得足够的生产成本补偿或盈利。但是学术作品作为一种公共品对社会是有贡献的,很多时候其社会收益大于生产成本或者固定价格(或有限的差别定价)② 下私人愿意付费的总额。于是社会发展出一种补偿机制,来激励人们从事学术生产活动。学术作品,特别是基础研究类研究成果,具有公共物品的特性,③ 个人的消费并不排斥他人同时消费。与其他物质类公共物品的不同之处是,同类作品(非同质)可由竞争性的无数个人来提供;其数量并无一个明确的界限,当然总体上受社会边际效用相等的约束。
对公共物品品质的度量始终是一个热门的话题。对学术作品这类公共物品生产的补偿,涉及到“贡献”的考核问题,即对其品质的考量。我们知道,一般商品具有多种质量维度,度量商品的质量是需要花费成本的。(Malinvaud,1972)学术作品也具有多种质量维度,④ 学者凭借其一定质量的作品获得报酬,也就是确立学者获得报酬权利的依据,因此度量的方法或规则,往往影响度量的结果,并且该约束条件影响个人的生产投入决策。补偿标准在不同的团体内有不同的规定,作为学者的反应函数中的一个变量,起不同的激励作用。对作品质量的度量也是需要花费成本的,这项成本该如何花费,以及该由谁来承担,涉及到度量的效率问题。
度量的费用,以学术杂志为例,印刷费加上编辑人员工资,每页费用在1000~3000元不等,其中人工费用占绝大部分。我们可以认为被刊登的作品是编辑在大量稿件中挑选以及比较相关研究的结果,有时候也需要花费资源约稿,由于人工费用的固定开支,因此对单件学术作品的度量(比较)成本是如此高昂,以致它具有明显的规模经济效应,大范围大规模的比较评估相对来说是平均成本较低的。⑤ 另一方面,学术评价系统与学术作品在产品属性上类似,在消费上又具有公共物品的特性,因此科研机构寻求外部的评估依据,即赋予其他系统评价的权利,是一项有效率的安排。
3.品质考核权的决定
产权安排可以显著影响人们的行为。在一个具有交易费用的世界里,初始权利的配置可以影响产权交易的效率。(Coase,1960)学术评价,涉及到谁有权评价学者的学术作品;依据评价结果,学者获得什么样的报酬(包括货币与声誉)。
对学术作品品质的考量权,是一个有待界定的权利集。广义上,人人都有权评价他人的作品,但是这种评价在多大程度上被社会承认,则每个个人或机构是不一样的。只有产生了实际的社会效果,从而影响了人们的行为,才是有实际意义的。在各类评价机构出现之前,可以认为评价的权利是一块公共地,人们可以自由地在这块土地上耕耘。但是由于不同评价者的产出是不一样的,即对他人作品的评价权威性不同,使有些评价结果被一些官方机构采纳,另一些结果则只是流于民间形式,不能给学者带来直接的货币影响。通常,纯粹个人的评价结果往往不被机构采纳,但即便如此,个人或者说某些权威对他人作品或贡献的评价,对被评价者的声誉仍然具有巨大的影响力。⑥
学术评价系统(可看作“物品”)是由竞争性的个体提供的。首先个体具有提供学术评价物品的激励,这种激励可以是得到上级的赏识,得到更多的资助,扩大自身的声誉影响,等等。其次,与学术作品不同的是,竞争性的学术评价物品,与一般商品市场的竞争类似,不能排除道德风险。但是由于竞争的压力,评价者会在追求客观化目标中的机会成本与所得之间寻求最大化均衡。另外,与一般商品市场一样,学术评价物品也存在先占者优势。
学者凭借各类机构或个人的评价来获得一定报酬以及声誉。声誉的大小取决于评价物品在公众心目中的权威程度,本文限于篇幅暂不分析。学者所获得的直接报酬,往往由一定机构给予,这些机构可以是学者所属单位,也可以是其他单位。因此机构有权决定评价依据的选择。机构的决定,实际上指赋予了其他机构或个人评价的权利。我们常见的给付报酬的机构是学者所属的学术单位,报酬(包含职称晋升)给付的依据通常有:在一定级别的杂志(出版社)上发表一定数量的论文(著作),获得一定级别或特定机构的奖励或课题资助,在一定级别的学术会议上发表演讲,论文获得引用的指数,等等。当然,这些机构也有权不参考外部依据,自行组织评价。由此派生出来的评价系统有:对学术杂志级别、排名或考核权数的确定,对学术机构业绩的考核或排名,对学者的排名,等等。评价系统内部的产权安排,决定了评价系统的客观公正性。⑦ 我们知道,各个评价系统是具有各种各样偏好的个人组织或参与实施的,个人目标的不同造成了评价系统实施过程中的目标冲突,进而损害最终目标的实现。并且也导致不同的系统具有不同的制度安排,出现迥异的实施效果。比如编辑制度的不同,导致不同的杂志质量;虽然有等量的资金支持,但是各个评价系统的权威性并不同。⑧
给付学者一定报酬的机构在可能的限度之内有鼓励学者努力从事学术活动的激励。激励的因素有,受制于机构之间竞争的压力,本单位科研成果的极大化有利于声誉的提高,并有利于获得更多的资助,或行政人员获得升迁的机会;依据一定的评价标准给予他人奖励或资助,有助于自身声誉或业绩的确立;等等。其限制性条件一是指资金限制,二是指其他目标的兼顾,比如人情关系,三是道德风险的限制,研究机构有动机花费资源,利用现有评价指标或其他条件从事有助于提高声誉却无助于增加成果数量或提高成果质量的活动。因此,科研单位有动机采用有利于自身的评价体系。某些情况下,一科研单位具有高级职称的人数越多,会被视为越具有研究实力,因此鼓励学者尽快晋升职称是行政人员的目标之一,这可以解释为何各家单位的职称晋升标准大不相同,即评价权利的赋予是各不相同的。我们可以断定的是,并非很多单位存在低效率问题,而是因为他们的约束条件各不相同,表现出了不同的学术生产效率结果。
不同社会有不同的规则决定各类机构多大程度上承认这些评价系统,即评价系统获得影响学者的权利。但在不同的体制下,出资者不同,评价系统被采纳的顺序是不同的。在自上而下的垂直领导体制下,下级对上级负责,科研机构对政府负责,因此凡是政府或上级单位主持的评价系统,往往受科研单位青睐。只有体制内缺失而体制外补充发展的评价系统,才有可能被体制内科研机构采纳,并且这也是要冒风险的。比如中国的现状。在政府仅仅是少部分资金的出资人,大量的资金由基金会或个人捐助的科研体制下,科研机构置于民间资金的直接监督之下,在采纳评价系统上具有更大的灵活性与真实性。比如美国的现状。
总之,学术评价系统的运作及其结果采纳,背后是有很多约束条件的,现实中的量化考核体制可直接归因于这些约束条件的作用。将评价依据转让给外部评估系统,并非行政人员偷懒的结果,而是因为评估系统的公共品属性或出于效率上的考虑。
三、理解中国的学术评价制度
上文已经提及,各类评价系统的类别有:职称评审,学术杂志,各级别奖励,课题资助,学术会议,引用率,杂志排名,机构排名,学者排名,等等。在我国,各个制度不是独立存在的。职称晋升制度通常规定学者必须发表一定数量与级别的学术作品,这与学术杂志的评价,学术杂志内部编辑制度的设定有关联。同时还可能规定学者必须获得一定数量与级别的奖项,以及一定数量与级别的项目资助,则与评奖制度与科研资助制度相关联。评奖制度通常面向公开发表的作品,则与编辑制度相关联。科研资助通常间接以学者职称、所获奖项、所发表作品为参照物(这有时候依赖于程序与规则的设定)。由于职称晋升制度的规定,可以将另外三项制度称作其外生制度。
在我国,各科研机构往往规定了学者晋升职称的条件,这相当于将评价依据与过程转让给外部评估系统。这虽然表面上看来大家有一个统一公平的标准,但也常常被众多学者指责为行政人员数字化简单化管理的结果,认为不能兼顾长周期研究以及数量少但质量极佳的学术贡献。但是,一旦完全由内部委员会投票决定,或少数权威商量决定,一方面众多学者津津乐道于半个世纪前芝加哥大学经济系这样的制度下的学术繁荣局面,另一方面如果在国内推行该制度又被众多学者指责为人情关系左右职称晋升,事实上我们也不断看到这样的例子。笔者认为,除了上文的评价系统公共品属性的理由,还有其他产权原因。一项权利要得到确立并得到保障或为权利相对人认可,权利拥有者须有能力保护自己的权利不被削弱,或者具有外部保障。我国自改革开放以来,绝大部分学科处于向西方追赶学习阶段,这一过程仍将持续相当长的时期。随着知识更新速度的加快,新学科、新分支不断涌现,学术分工越来越细,昔日的权威越来越跟不上知识更新的速度,⑨ 年长的“权威”往往难以评判各个学科分支学术的创新性或价值,也就是越来越没有学术能力维持其评判权。可以认为,权威在人事上并不存在垄断权,在显失公正的情况下,学者们仍然具有用“脚”投票的权利。外部保障是指行政当局是否赋予权威或委员会完全的投票权。我们知道,在以成果数量加权计算的学术机构排名系统的作用下,科研机构有机会在成果数量上显示自身的研究实力与科研业绩,以获得外部更多的资源,因此科研机构会以与科研排名系统类似的指标体系(权数)来激励研究人员,⑩ 而权威的完全投票权将使极具研究实力的学者可以较少的产出获得较高的报酬,从而妨碍科研成果数量极大化目标的实现,因此往往不被科研机构行政当局重视。也就是说,权威们既没有足够的学术能力维持自己的完全投票权,也没有足够的外部行政支持。在科研机构相互竞争的格局下,博弈的结果就是纷纷实行量化考核体制。这也可以解释为何自上世纪90年代以来,越来越多的科研机构将评价的权利转让给外部评估系统并将其量化,而各种评价系统也不断地产生并得到更新,比如引用率指数是本世纪初前后才出现的新指标。事实上,即使在欧美国家,也越来越注重外部评估系统的作用了。但是在量化考核体制下,有时候会使考核结果与学术目标严重偏离,进而损害了机构的学术声誉,因此有些情形下,会存在量化考核与委员会投票共存的局面。
在政府出资的评价系统下,评价系统的实施者可以看作政府的代理人,这类似于企业理论中所有者缺位的情形。在花费资源建立有一定影响力的评价系统之后,可以认为该项资产已经具备一定的利用价值,人们愿意花费适当的资源获得全部或部分该资产是题中应有之义。在所有者缺位情形下,寻租理论已经为我们说明了这一问题。我国所发展的评价系统几乎都是有政府出资背景的,大量的寻租现象是不可避免的。需要补充说明的是,评价系统实施者仍然有保持或提升既有声誉的目标,有时候也取决于外部压力,因此各个评价系统的寻租情况是有差别的。寻租情况也取决于执行者所处的其他环境差别,我们可以理解有些中西部地区的学术杂志大量存在收取版面费的情况。而有些评价系统,由于影响力巨大,并且即使质量有所下降,科研机构也不愿意取消其代评权,因为质量的下降反而有利于更多的发表或上榜机会,对显示出的业绩起促进作用,因此质量的少数下降并不损害该系统的使用价值,而质量的下降可以换取更多的租金。另外,即便是民间资金支持的评价系统,也仍然存在代理问题。另一种可以设想的情形是,科研机构对评价系统质量变化的反应存在时滞效应,这可以部分解释为何有些经济学行内奖项的得奖数量会越来越多。
四、小结
对学术评价问题多年来存在量化评价与非量化评价的争论。尽管不同时期充斥了对量化评价的批评,尽管学术的发展方向或重大问题的创新性研究通常并非量化考核的结果,但社会仍然发展了一套量化评价系统。学术或学术作品作为一种公共品,对其成本的弥补需要以效率为原则,度量其贡献一直是人们的愿望并常常付诸行动。代替社会弥补学者研究成本的机构,有权决定评价标准或选择评价系统。但是评价系统的选择、评价系统本身的运作由于受制于执行者的目标不同、代理问题等原因,并非总是可以得出人们设想的有效结果。另外,不同体制下评价系统的作用是不同的。在中国,量化考核体制是学术发展的结果以及行政目标影响下的结果。这同时也造成了国有资金支持下的评价系统寻租的现象。
注释:
① 对个人的评价总的来说都可归为对个人学术作品的评价,因为个人的学术贡献总是可以物化于其学术作品之中。
② 这是学术作品通常的定价方式。
③ 有少数学术作品可以归为俱乐部物品或私人物品,比如一国的行业分析报告,对国内产业的任何企业都有用,但可能出于竞争的考虑,如果被国外企业得到,可能会损害国内产业的竞争力,因此该报告的俱乐部范围相当于国内行业。再比如张五常曾在上世纪七十年代末期为某石油企业做的产业研究报告,被其独家买断,估计出价数量可观,如果不考虑机会成本,估计也能弥补张的全部生产成本且有盈余了。此报告可被视为私人物品。尽管围绕产品的买方市场制作了各类作品集合供人们选购,但是这类盈余似乎从来没有到达作者手中,因此不能由此而否定学术作品的公共物品性质。
④ 一件作品可能对不同领域的研究都有借鉴意义,但是某一领域的学者通常只看中与其直接相关的有用维度。
⑤ 这个结论并非意味着诸如学术杂志规模越大越好,因为它还受到其他因素的限制。对杂志最优规模的研究是一个有趣的方向,可以让我们理解为什么有些杂志尽管编辑人员很多,却相对规模较小的现象。
⑥ 非行内人士往往对他人作品没有鉴定能力,非行内对行内人士的肯定往往建立在行内的评价基础之上。
⑦ 对不同评价系统内部产权安排的分析是一项庞大的工程,笔者将另文专述。
⑧ 曾有人批评说某机构组织的大学排行榜夸大了某学校的排名,因为此机构的负责人毕业于该校。
⑨ 学术界公认30几岁阶段的年轻学者往往站在学科的最前沿,40几岁以上的学者虽然在研究经验上有优势,但多数跟不上学术前沿发展的形势。
⑩ 如果完全以科研排名为目标,则内部考核的权数必定与科研排名的权数相同。