人文社会科学评价的局限与超越_量化管理论文

人文社会科学评价的局限与超越_量化管理论文

人文社会科学评价的限制与超越,本文主要内容关键词为:社会科学论文,人文论文,评价论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

人文社会科学评价(简称文科评价)问题在当前引发了许多争议和非议。文科评价本应是一种学术评价,它应由学术共同体主持,是以推动学术的继承和创新为目标、与资源配置相联系、与物质—精神激励相结合的学术体制。但是,现行文科评价系统、评估标准,很多是从理科评价和工程评价中简单搬过来的,模式单调划一,方法机械简单,加之迷信量化考核,追求数字指标,在社会风气不正的背景下,容易把“经”念歪。特别是在具体评价活动中,受到大量非学术因素的干扰,学风浮躁,弄虚作假猖獗,明显悖于人文社会科学的特点和内在规律。突出的矛盾在于:一方面,人文社会科学研究规模急剧扩张,成果迭出;另一方面,现行的文科评价存在诸多不足,似乎已到“黔驴技穷”的地步。对这些问题,应有清醒的认识和适当的对策。

一、评价者角色的失范

公正公平的人文社会科学评价活动能否开展主要取决于一个恰当的评价体制,这首先要求制定一套好的制度,而好的制度本身就意味着,只有那些既具有公信力又具有鉴别力的学者才有资格出任评价者的角色。为此,会预设一系列的机制,以防范评价者的道德出轨,保证良性评价制度的实施。

然而,正如有人批评的,当前的文科评价体制不期然造就了另类“学者”,即在通常的学术研究者之外,形成了颇成气候的另类——可称之为“学术活动者”的准学者。他们“三分治学,七分攻关”,精于拉关系、走后门、搞交易,善于揣摩刊物编辑心思,工于琢磨评审部门之所好,修炼出一套擅长于在高级刊物发文,在国家级、省部级获奖或中标的“真功夫”。其对名誉则当仁不让,对报酬必拿首份,是现行学术评价体制下的“弄潮儿”,其身份正逐渐向学术“掮客”转变,最后变成自己不搞学问的“老板”。[1] (P51)在这样的评价体制下开展的各项活动,常常招致广泛的批评。

在人文社会科学的评价中,专家系统十分重要。专家系统是某种学术团队,用以同行自治和评价。学术活动特别依赖系统的自治和共同体内部的评价,因而专家系统的自主权对于知识认定和制度安排来说是不可缺少的先决条件。对于学术争鸣,外行并无发言权。专家系统具有相对的独立性和自主权,才能保证其独有的解释权威。如果非学术组织和因素过多渗透和干预,会使之失去信用。

不过,这种独立性和自主权在中国的文科评价活动中目前却难实现,因为专家系统及其同行评议所受干扰太多。评价者的学术名气是一个强相关系数。理论上,评价者的学术水平应是参与评价的先决条件,应当仅以自己的专业眼光来评价学术成果的价值,而不掺杂专业之外的因素。但实际上,在评审的时候,利用名人的声望来占便宜的现象经常出现。中国社会是一个人情社会,谁也摆脱不了求人帮忙和为人帮忙,这对于客观公正的学术评价是不利的。在中国特有的“差序结构”中,作为一个“单位人”,每个评价者都名正言顺地要为本部门争人才、争学科点、争面子,要为朋友、同事争资源、争奖励,等价交换原则大量渗透到评审中,因而在各类机构的评议中,“同行评议”也有很大的局限性。有研究认为,当前同行评价机制的作用有弱化的趋向,主要表现在:(1)评审专家专业知识不足,遴选与组成不科学——“外行评内行”、“内行是杂行”、“内行不懂行”;(2)制度不健全,操作系统不匹配,同行专家难过人情关、行政关;(3)同行因信息不对称,难以对作品、项目和机构进行客观评价,评价结论的产生过程不规范等。[2] (P745)评价者由此发生了角色错位,成为某部门或某个人的代言人,使正常秩序下的公平竞争蜕化为无序竞争。

此外,非内行的评价者占的比重过大,也到了不容忽视的地步。似乎谁都可以对人文社会科学进行评价,其实,外行对所评价专业的语言、方法和动态不了解,对相关的背景文献不熟悉,是很难对评价对象做出公允判断的。学术权威和权威的学术机构在不能自我控制、不掌握最新科研成果的条件下,有时也会良莠不分、不识精萃,把与主流观点相违背的学术成果当作无意义的“次品”、“废品”抛弃掉。尤其是那些与传统思想、传统理念相背离的观点,有时恰好被一些权威学者错误地否定,这样就阻碍了创新。

从其本质来说,出现了一种“学术经济化”的现象。在市场经济体制建立和完善的过程中,由于市场价值观念的负面效应波及,学界产生了许多功利至上、弄虚作假、大肆炒作、假冒伪劣的行为。“学术经济化”是一种可悲的错位。有些人顶着学者头衔,却心有旁骛,在项目申请中,使用走关系、谎报成员等不正当竞争手法;争到项目后,又将经费用于奢侈采购、宴请、旅游等非科研活动;到结题时使用抄袭剽窃、粗制滥造等手段,赶制“学术成果”应付了事。诸如此类,屡见不鲜。“跑课题”、“跑经费”、找熟人、托关系等现象成为学界的一大独特“景观”。

这些现象又与文科评价的制度环境很有关系。在许多高校和科研单位中,都把能否获得基金资助和课题赞助,列为学术工作者能力强弱、是否具备晋升资格的重要依据。尽管人文社会科学与自然科学不同,其研究活动不需要太多贵重的仪器设备,部分研究项目也不需要做长期、大量的调查寻访,只要求课题主持人有敏于思考、善于思考的头脑,以及相当数量的图书文献资料。遗憾的是,评价人文社会科学工作者的“价值”往往都会有一项“课题一票否决制”,规定凡没有主持或参与省部级以上科研项目的人员,在评价中一律作“降级处理”。这就人为地使不少科研人员将主要精力放在拉关系、跑项目上,而很少花工夫搞教学和科研。在各单位的评价体系中,看重的是课题拿到没有,至于课题做了没有、做得怎样则是次要的,因为争得课题比完成课题所获得的评价分值要高得多。也就是说,许多课题研究者,往往拿出大部分精力去搞课题设计、去参与中标的种种“公关”活动,而用在完成课题上的时间和精力就不多了。

从大处说,人文社会科学的评价涉及众多不同的评价对象,包括宏观层面的学科评价,中观层面的机构评价与科研评价,微观层面的成果评价与科研人员评价,对评价者的具体要求是很不相同的。就学术成果评价而言,人文学科与社会科学两者,一个以人的生存价值和生存意义为其终极主题,一个以经世致用为其要义,评价取向显然不同。如果再深入到学科内部,文、史、哲、经、法、社、教、管等各门学科各具特色,评价就不能不关注其个性化特征。此外,对于人文社会科学中论文、论著、报告等不同成果形式,标准也是各不相同的。更困难之处在于,如何判定一项基础研究类型的哲学著作与一项应用研究的社会报告究竟谁的价值更大?往往不能简单行事。总之,恰当评价者的遴选,其关系实在太大了。

西谚有云,“任何人均不可为自己事务的法官”。学术精神的本质在于自由,学界的主流价值是求真。东西方文化尽管有许多差异,但在要求评价者的“道德—文章”二者不可偏废方面,却是相互呼应的。评价者应当自律、自爱、自尊,不以物喜,不为物累,珍惜学者的学术操守,坚持学者的独立人格。评价者在同一话语体系中进行学术对话和交流时,不能有过分的随意性。特别是对利益分配,一个人不能既参与分配,又主持分配;既是“候选人”,又兼任“评选人”;既是“运动员”,又做“裁判员”。否则,即使主观上力求公正公平,客观上也很难让别人心悦诚服。

在学术活动已高度职业化的今天,学术的无私利性只能是一种理想化的期待。在现实中,学术活动面对严峻的挑战,因为它受到很多不正当研究行为的影响。爱因斯坦也认为,在科学的殿堂中,追逐功利型和智力快感型的人总是占多数的。通过科学职业,以谋求职衔晋升、博取社会声望为动机的“私利性”已为学界不少人认同。而这种“私利性”是花了纳税人的钱运行起来的,对于“取财无道”的某些学人,需要有社会舆论的批评和监督,亦即评价者也需要对外部系统保持一定的开放度。文科评价系统作为社会道德的风向标之一,如果不正当评价行为从评价者个人发展到整个学术共同体,必将触发全社会的信任危机。

二、对量化方法的迷信

20世纪90年代以来,为便于对学术研究从事管理和激励,许多学术机构都引入了学术成果定量化评价方法。通过定量规定研究成果的等级,计算研究成果的数量,赋予教学和科研人员的劳动以不同的分值,从而加以计酬和奖励。在美国首先出现的量化方法在当今中国最初是在理工科得到认同,接着呈现出强化和扩张的趋势,最后在文科中也几无例外。但它在文科评价中淋漓尽致的表演,引发了大量的批评和争议。

学术管理的定量化被西方学者称为“麦当劳化”,其核心是专注于“形式理性”:可计算性、可预测性、效率至上性、技术取胜性。[3] 量化评价提出的所谓在经费、学科点、院士数、成果级别、经济效益等要素的计量上一视同仁或按比例换算的法则,其结果是极大地伤害了人文学科和教育,从机构到学者再到成果的人文社会科学各个层级,被整体矮化。这个思路的片面落实,直接导致了人文社会科学之间的恶性竞争,使得强势机构(和研究者)愈来愈强,弱势机构(和研究者)愈来愈弱,学术竞争环境趋向恶化。

当前文科成果的评价,首先是试图设立某些所谓硬指标(即可数量化的指标),对评价对象的学术水平高低、学术成就大小、学术价值优劣作出判定,在这个意义上,评价更多的是比较评价对象在学术价值等方面的量的差别,其后再涉及对评价对象质的判定。究竟是着重以定量的方法来区分评价对象的量的差别,还是着重以定性的方法来区分评价对象的质的差别?或者是着重二者如何结合?这是当下分歧的焦点。

然而,在评价实践中,被评价对象的“量的差别”问题,其实本身就是充满陷阱的。无论是定性方法还是定量方法,首先都要面对“量的差别”。

在对“量的差别”的把握中,定性方法强调的是基于理解的“直接认识”,评价者依据个体的经验与学识水平对评价对象的学术价值、水平给出直接的判断;定量方法必须要做的是,首先找到衡量差别的可操作性定量指标,然后再以该指标的量值来客观表征原来难以量化的“量的差别”,如以引用率的高低来表征学术成果的优劣,体现为“间接测量”。直接认识与间接测量的差别才是定性方法与定量方法在人文社会科学成果评价中所必须关注的。直接认识,可视为思想与思想的对话,直接深入评价对象的意义世界、价值世界,是对评价对象的直接感悟、理解与解释。但任何基于评价者个体的定性判断都是主观性的,受限于评价者个体的经验、学识、所处文化环境等各种因素,在这个意义上,一切定性判断又都难免其个体的局限性。间接测量的长处在于其客观性,可以基本排除评价者主观性的影响,更客观、清晰地描述出量的差别的程度。其短处在于,指标体系的设定是带有很大主观随意性的,间接性指标与评价目标的相关性也是难以完全确定的。实际上,它强调的是当下性和现实需要,是用数字掩盖的倾向性。

我国时下风行的学术量化评价涉及的领域十分宽泛。每个学术机构都可以围绕论文、著作、课题、奖金等不同目标,建立自己的得分即量化指标体系,把学者研究成果的价值按照“课题、著作、论文、译著”排序,按级别、数量、排名位次赋予分值,把职称评定、岗位聘任等凡与学术研究有关的活动都纳入量化的范围。受成果量化的影响,科教文卫各机构,教师、医生、干部、职工等人员,都要求发表一定数量的学术论文,要有一定的“科研工作量”,才能上岗、评优或发放津贴、晋升职称。这种硬性规定自然会鼓励低层次或速成式的写作,造成“成果”泛滥。不少人无可奈何,每年都为此投入大量精力拼凑所谓的“学术成果”。有关部门为了满足这一庞大群体的需求,“大跃进”式编辑、出版、发行各类增刊、文集、专辑等。在虚假学术繁荣的表象下堆积起无数的泡沫文字,湮没了真正有价值的学术研究。[4] 这样的量化评估导致研究人员不去努力实现研究目标,而去追求获得最大的计量得分。量化评价方法激发了大量回避重大难题的短期功利行为,以及把成果拆解发表、重复发表、增加自我引证等对于学术研究本身并无意义的行为。

量化评价指标体系的随意性、加权方式的人为性,更是难以准确而有说服力,价值序列的合理性也受到种种批评,其中“核心期刊”的名分最为引人争议。目前在中国,最受关注的中文“核心期刊”目录有三个:北京大学的《中文核心期刊要目总览》、中国社会科学院的《中国人文社会科学核心期刊要览》、南京大学的《中文社会科学引文索引》。大多数学术机构都以这三个目录为基准,作为科研成果量化考核的依据。但把一种“参考工具”当作实际的考核依据,难免带有形而上学意味。上述三个目录也有指标体系不一、赋予权重各异、彼此之间结果有很大差别等问题。如果把应用型文科、理论型文科、咨询性研究、学理性研究等不同类型的成果放在一起评价,强不可比而硬比,并以是否在“核心期刊”发表为标准来计量科研成果的价值甚至作者的价值,怎能不让人生疑?

量化模式更不利于学者个性的发展。任何学者应该都有个性,最有学问、最有思想的学者往往也是个性最强的人,其发挥专长的表达方式时常与众不同。科学的价值观本身,要求用怀疑和批判的态度对待一切既成的理论,学者的任务并不在于总要去证明什么,有时倒是企图去怀疑什么。

几乎所有的人文社会科学研究机构都认定,凡进入国际索引系统论文的价值均高于国内期刊发表的论文。如果有幸发表在诸如社会科学引文索引(SSCI)、人文社会科学会议录索引(ISSHP)、艺术与人文学科引文索引(A&HCI)等国际索引系统的论文都能得到很高的奖励和赋值,反之就差远了。结果,以北大为例,人文社会科学的得分不及理科的三分之一,顶尖文科的得分只有最好理工科的五分之一。[5] 统计下来,人文社会科学只能处于陪衬的地位。这是很奇怪的,因为这些文献索引系统只是收集了一个时期内此类书刊在世界范围所正式发表的内容,被当前文献索引收录只是表明某书或某刊已经发表,并不涉及对该书刊所收录成果的评价问题。尴尬的是,近年来我国在以国外引文索引期刊发表为导向的学术研究呈现出数量方面的强劲增长,但有价值成果、优秀学者的产出简直与其不成比例。

学术成果的灵魂是其思想学术水准。学术成果的价值必须经过一定的时间才能看清楚,无论是评价成果、评价学者还是评价机构,都应当留出一定的滞后时间,不能患有“近视症”。衡量学术成果的价值,最终标准只能是历史和实践。大量的人文社会科学案例说明,相当一部分学术成果问世之时并不被人们看好,甚至遭到主流社会激烈反对,但后来的时间和实践却证明具有极高的价值。

文科量化评价方法在中国的出现,与学术研究职业化和小科学时代向大科学时代转型期间国家强化对学术活动的干预有深刻的内在关联。不可否认,量化方法具有一定的合理性,但这种方法的作用不可高估,它毕竟只是对于管理具有工具性作用,在学术活动中仅供参考。况且,国内外有识之士已对其消极后果有了清醒的认识。“平庸学识的过度产生是当代学术生活最夸大其词的做法;它会因单纯的篇幅而隐匿了真正重要的著作;它浪费了时间和宝贵的资源。”[3] (P112)

三、过度行政化与学术腐败

20世纪20年代以来,中国文化人认识世界的知识基础,已经决定性地脱离了传统经学的桎梏,而转换为以科学为代表的近代体系。评价语境的奠基,标志着中国学术的转型,此后的学术活动,难免面对学术评价权力的争夺。但在对学术权力的争夺中,文科评价中的行政干预无处不在,造成了文科评价的很多“硬伤”。

首先造成困惑的是评价主体问题,即人文社会科学应由谁来评价?由政府一家垄断评价显然是不合适的,这容易导致过度行政化倾向和腐败。但由谁主宰评价才恰当呢?当前评价发展的总体趋势是,由政府主导向学界自主评价过渡,或者由政府、民间共同评价,社会化的多样的评价中介机构有取代单一的评价主体之势。但多元化评价主体可能造成学科资源各自为政,各种评价层出不穷、口径不一的乱局,而且,各种评价主体有可能代表不同对象的利益行事,常常把学术标准搁在一边,导致非学术的考量占据很大比例。

其次是所谓评价程序问题,即人文社会科学评价的可操作性何以实现?这里有一个由实质评价到程序评价的问题,是指既然实质公正很难达到,那么追求程序公正就可能最接近于合理地达到评价的目的。但是,谁来保证评价程序的恰当制定和坚决实施呢?

文科研究成果的评价反映出学者们的诸多无奈。其一,学界和民间组织的权威性评奖很少,且让人议论纷纷,而主管部门组织的评奖则由于主管官员主导的色彩甚浓,官员或准官员所占的比例往往远高于一般研究人员所占的比例,评奖的学术水准很难让人信服。其二,除了行政官员,“学官”的作用也不可小视,越是高级别的评奖,“学官”的发言权和投票权越大;申报人的级别越高、头衔越大,其可能得到的“资格分”、“同情分”也就越高。其三,在评奖过程中,本位主义、地方主义,以及会上会下的游说攻关,给予公费旅游、高额评审费等现象愈演愈烈。在此背景下,评奖结果的学术含量就不能令人信服了。[1] (P61)

一般来说,行政官员与学术官员彼此都是比较熟悉的,“学官”之间更是经常打交道,于是,在评委会及获奖、中标者中,“学官”的比例便比其他学者高得多了。这时,“学而优则仕”与“仕而优则学”是并行不悖的。目前,在学界内部,最有评价发言权的往往是“学官”而不是学者,其派生的产物是,“学官”可以跨行评价,而学者却对同行也鲜有评价的机会。拥有一定行政权力和职责的部门必然要以长官意志左右评价方向,行政品位与学术品位难免会发生冲突,官员身份与学者身份也难免发生矛盾,这样肯定不利于特立独行、标新立异的学术创新。

正确评价一项科研成果,必须充分了解国内外在这一领域的研究现状,并实事求是地在学术成果中确切交待前人已经做过的工作,自己的成果是否具有创新性,这些高度专业的问题只有依靠研究本身,依靠同行的集体审议,才能做出正确判断。但当前我国人文社会科学界有一种不正之风,就是一旦取得成果,首先想到的不是同行的意见,而是领导和官员的看法。事实上,任何一位领导,即使是自己有很大成就的科研工作者,也无法对所有专业的每一个细节问题都了解清楚。可以说,受行政干扰的文科成果评审过程必定是受人非议的。[6] 以“领导指示”作为评价研究成果的依据,极有可能诱导“官”、“学”勾结,促成新形式的行政腐败和学术腐败,行政干预则极有可能造成“同派评议”、非理性拔高等严重问题。

文科评价中不可回避的是恰当处理学术权力问题,即如何运用和支配学术资源的权力,包括课题评审权、成果鉴定权,以及发稿权、晋升权,等等。改革开放以来,学术权力得以恢复和重整,学界从过去的“清水衙门”转而成为可以获取权力和金钱的“黑土地”。在“官本位”依然盛行的中国社会,学术研究活动受到政治因素的严重干扰,产生“学术政治化”现象。主要表现在:“官大学问长”;学术权威的负面效应增强,学阀现象、学术剥削严重;学术权力寻租等。[2] (P743)

政治(权力)粗暴干扰学术在中国曾经有过的教训是十分深刻的。在以“阶级斗争为纲”的年代,中国的学术史几乎成为一部政治评价的历史。在奉行文化专制主义和历史虚无主义的“文化大革命”时期,学术活动则完全中断,学术思想被全面扼杀,学者被诬为“牛鬼蛇神”,这时候的学术评价完全被“大批判”取代。人们当时对学术问题的理解,在相当程度上是从政治权力运作的功利目的上去掂量的,从逻辑上是难以理解的。

改革开放以来,我国的物质生产拥有了比较宽松的环境,其发展变化史无前例,但精神生产相对来说“发育不良”。对于学术研究所必需的资源,在很大程度上处于行政支配和垄断之中,并且,从行政本位延伸到学术研究的“官本位”。在这种背景下,从官本位派生出的定量化管理,发酵成当前人文社会科学评价的严重弊端。

“官本位”条件下的人文社会科学量化评价带有浓重的行政主导色彩,学术活动的价值大致取决于其被认同的有关行政部门的级别。当前学术依附于权力有两种突出表现:一是学人争当“学官”,二是学人随“上峰”摇摆,这都是“官本位”思想在学术界的直接反映,严重侵蚀学术研究的基本价值。受此影响,人们的学术质量意识淡薄,在一定程度上,学术创造沦为商品生产,学术堕落和腐败愈演愈烈,就一点也不奇怪了。章太炎曾把从内脏烂起称之为“鱼烂”。学术腐败是“鱼烂”的典型,是当前权力腐败的一种表现,是危害学术风气和社会风气的毒瘤。近年来,不断泛滥的抄袭剽窃最为令人头痛,揭露、抨击学术腐败是学界热门话题。业内人士都认识到,如果不遏制猖獗的腐败行为,如果违反规则的现象竟因权力庇护而无从追究,那么,评价公平与公正便无从谈起。

不少学者认为,同行评议有别于行政评价和公众评价,对于开展科学决策和分配学术资源具有举足轻重的作用。但在中国的具体国情下,学术机构的“官本位”,决定了学术独立的困难,同行评议也会沦落成一个“熟人关系网”,在一些难以隐名的评议范围内造成“熟人好办事”。“要获得政府资助的研究项目将取决于‘你是什么人’。许多申请项目获得资助,主要是因为这些申请者已为资助机构所熟悉和已受过其资助。”[7] 由这样的权力因素所左右的学术评价活动,正如有人所说的,想不腐败都难!

四、评价体系的基本限制

人文学科传统上是主流学科,经史子集,内容包罗万象、丰富多彩。在现代中国,人文社会科学作为思想保证、价值导向、智力基础和精神凝聚力,在社会生活中日显重要、不可或缺。人文社会科学的发展就其本性而言,要求评价体系与之相适应,但评价体系往往具有滞后性和有限性,突破性成果不符合评价标准之事时有发生,对评价体系的这个基本限制必须了然于胸,并努力寻求超越之道。

“郑人买履”的故事说:“宁信度,勿自信也。”这种削足适履的情况类似于现代某些学者和学术管理者把评价规范看得比学术发展本身更重要,宁可“戴着镣铐跳舞”。“度”、“镣铐”指的是学术规则、评价条例等。由于“度”和“镣铐”的束缚,特定时代的绝大部分学者,只能遵循社会认可的、在前人那里行之有效的学术思路行事。这种境遇,虽然有利于常规学术的积累和发展,却让那些“天纵之才”感到压抑和郁闷。[8]

目前,令人不安的是,文科评价设计者的主观意向性太强。就文科学术机构所颁行的各种条例、办法、规定而言,不同机构的选择会有很大的不同。在学术规则、评价条例的“权威”引导下,学术机构的资金、职称、岗位,以及由此带来的住房、汽车等待遇问题作为稀缺资源也成为学人争夺的对象。为了得到更多的资源,科研人员急功近利,使出了九牛二虎之力,“应急作品”大量产出,却多是学术上的无效劳动或学术“垃圾”,对读者、对社会并无意义。

依据软性的评价标准,具体成果的价值估定最终取决于评价的主体。但20世纪中叶以来,知识的急剧增长,伴随学术深化带来的研究领域的细分,学者们很难再有精力“邃密群科”。如果涉博,势必就不能臻于精深。即使在一个学科内,往往也不能精通各个研究领域,不能对什么问题都拥有发言权。杰出的学者也多是某个分支的专家。面临具体成果的评定,要做出客观公正的评价是很难的。

将学术评价囿于固定规则之中,显然是盲目而幼稚的。有些人文社会科学家一生发表论著甚少,但每一篇都是分量沉沉。而有些学人发表论文数以千计,尽管生前可能声名显赫,却没有留下“精品”、“上品”、“传世之作”。即使那些在国外发表的论文,价值也差别很大,不能一概而论。

有学者认为,中国人文社会科学学术发展的最大困惑是自己的研究“范式”尚未建立,而试图靠评价规则来解决建立范式的问题实际上是差强人意的。对评价规则的遵守,是拥有某个共同范式的学术共同体的公共行为,但人们无法在实质意义上确定一个普遍的、必然的、绝对的评价体系。学科不同,评价体系就不可能一样,若以某种具体的学科标准作为所有知识门类的共同规范,那么,“知识的地盘”将会不断萎缩。[9]

将学术产品质量进行等级评估,并与学术资源分配相联系,是近代社会的事物,并且曾是自然科学的“专利”。因为自然科学的特点是其客观性,自然法则能否成立,程度如何,必须接受观察实验的检验;与此相联系的资金问题又涉及哪些研究机构和研究者个人值得资助。这样,“能不能评估”和“要不要评估”都必须也可能给予回答,评价制度便应运而生。

然而,人文社会科学与自然科学不同。中国古代以文史哲为核心的人文学术,以及西方的神学和哲学,都具有很强的主观性,学者们没有不认为自己的观点是好的、值得认可的,学术产品之间找不到公认的标准来衡量高低上下;另一方面,古代学术活动往往是私人性质的,学术圈子很小,即使评估也是直接的,用不着量化。

学术评价问题,说到底就是一个分配正义的问题。分配正义指的是“对物质、利益和社会责任的公平配置”[10]。学术评价的目的,就是期望学术劳动能够得到与其贡献相当的回报,包括职称的评聘、荣誉的授予和经费的资助,并赋予相应的社会责任。这里的关键是,如何做出“给予每个人以其所应得的”判断,如何进行“分配”。由于当前中国的评价体制公信力不高,缺乏一流学者支撑,计划色彩浓重,匆匆兴起的文科成果评价的定量化办法,又在短期内直接影响到研究者和有关部门的利益、声誉和资源配置,分歧自然非常大。

一般认为,国家实力包括“硬实力”与“软实力”。相对于自然科学,人文社会科学“软而无形”,是一种“软实力”。自然科学“显性”的“硬件”作用与人文社会科学“隐性”的“软件”作用,好比车之两“轮”、鸟之两“翼”,共同构成社会全面进步的支撑点和驱动力。作为“隐性”“软实力”的人文社会科学成果的突破到底怎样衡量,如何给成果的创造者应有评价,却鲜有公认的标准。

目前,如何确立人文社会科学的评价体制,是学者们最为关注的话题之一。有学者认为,人文社会科学评价体制有三个层次:一是核心层,即评价制度本身,包括宏观的学术机构评价、中观的学者评价、微观的学术成果评价;二是环境层,即学术活动的内环境,包括学术理念、学术机构的权力结构、学科结构与教学模式等;三是社会层,即学术活动发生的社会政治经济结构、意识形态取向、文化背景与道德状况等。[1] (P26)三个层次的规范化必须环环相扣,相得益彰,才能逐步推进这一制度朝着公正公平的方向演化。

评价体制的使命是选拔优秀人才,激励先进成果,推动学术进步。建立学术评价的努力,固然无力阻止学术垃圾的产生,但应该有效地评定何为垃圾、何非垃圾。由于评价制度是一定时期社会政治结构尤其是教育文化形态的反映,所以不能就评价制度本身讨论评价制度,而必须将其纳入现代国家体制的大系统中进行考察。

评价体系对人文社会科学学术活动的发展常起着制约和导向作用。一方面,中国人文社会科学界应积极探讨具有中国特色的学术评价制度,确定出一整套控制学术研究质量的办法,其程序的公正性、有效性必须得到学界普遍认同。要提高文科评价的科学水平,摒弃急功近利或投机取巧的不端行为,引导文科学界形成诚实、刻苦、严谨、扎实的学术风气。[11] 另一方面,尽管文科评价体制存在着不足,却不能弥漫虚无主义思想。举世尊重的诺贝尔奖的遴选程序,也和任何奖励的评选程序一样,不可能没有缺陷。诺贝尔奖评选委员会就坦承:我们不可能发现谁是最好的,因为谁也不能给最好的下定义;即使尽最大努力,疏忽和不公正也不可能杜绝。[12] 因此,正确的做法应该是:在借鉴和吸收中改进。

一个成熟的评价体系不是理论思辨的结果,而是在实践的互动中诞生的,其中评价主体、评价对象、评价目标与评价方法的互动是极为重要的环节。每一种评价方法,包括量化方法,都有其方法所限定的内在目标,只有充分认识了这些内在目标才能更好地建构评价体系。事实上,方法的局限就是评价的局限,不深入分析所采用方法的不足,就很难恰切了解评价的真正内涵和指向。因此,我们不仅要研究方法的技术性问题,更要研究评价技术后面的目标和内在设定。

标签:;  ;  ;  ;  ;  

人文社会科学评价的局限与超越_量化管理论文
下载Doc文档

猜你喜欢