关于基础研究成果的“客观评价”的评价——兼论当前我国采用SCI评价标准的必要性,本文主要内容关键词为:评价论文,必要性论文,研究成果论文,评价标准论文,当前我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:G353 文献标识码:A
近几年,在中国学界悄然兴起了一股SCI热潮。用SCI作为评价学术论文质量,进而成为评价科学工作者科研能力的标准。但是激烈的争论也伴随而来:论文的引用率真能反映学术论文的质量吗?下文将通过对引用和质量的对比分析还SCI以真实面目。
1 科学计量学及其方法论
随着科学作用的日益显著,科学的“作品”几乎遍布世界任何一个角落,对科学以及科学家的评价也由内在评价(科学家集团的内部评价)转向为外在评价,适应这一要求,科学计量学应运而生。它来源于对科学进行定量的统计分析,把数学方法应用于处理因果关系。由于第二次世界大战后科学论文数量与日俱增,加之电子计算机的出现更加推动了这一方法的应用。德里克·普赖斯(Derck Jde Solla Price,1921-1983)继承前人关于科学定量分析的已有成果,构建起了科学计量学的结构图式,成为科学计量学的理论基础。在此基础上ISI于1963年编制了《科学引文索引》简称SCI(Science Citation Index)[1]。这一检索手段的出现为科学计量学提供了行之有效的运行工具,成为评价学术论文的专门指标。
在科学计量学的领域中发展起来的方法论有①IF分析法;②引用分析;③共引用分析;④共语分析;⑤数学模型。其中IF分析和引用分析(SCl)成为迄今为止评估学术论文质量的两个标准[2]。其中期刊的质量与IF有很高的相关性,而IF=Q/L,Q为一、二年内某期刊的被引用数;L为在这一时期内该杂志上载的论文数。所以在IF高的期刊上发表的文章其被引用的可能性就大。因本文主要讨论学术论文的质量与引用率的关系,所以在此不对IF进行深入的讨论。
像这样,SCI(引用分析)从可能测定的量来理解学术论文的质量,这是它的研究域。这一方法通过定量的数据,使如何评价学术论文更加具体化、可行化了。那么,论文的引用率真能反映论文的质量吗?我们有必要先来分析一下何谓论文的质量?
2 何谓论文的质量,评价论文质量的问题探讨
(1)语言学的探究 下面有必要从词源学上对论文的质量作一下剖析。关于quality,郑易里等主编的《英华大辞典》;金田一京助主编的《新明解国语辞典》;李振华,杨广育主编的《最新牛津现代高级英汉双解词典》;颜元叔主编的《时代英英、英汉双解大词典》中将其解释为9大意项,见表1。
表1
序号
quality
译文
1 That which distinguishes
特色;特性。如:颜色、
one person or thing from
重量、技能等
others,as color,weight,
skill,etc.
2 Essential nature;kind
天性、本质
3
Degree of excellence
质地
4 Trait or characteristic
品性;特性
5
Special virtue
才能
6
Rank.
身分
7 of musical sounds,distinc- 音质,音色
tive tone
8 A newspaper or magazine
专业书报;纯学术书报
usually of limited circula- [因提供一些高级或特
tion because of its appeal to 殊读者阅读而发行数
a sophisticated or special-
量有限的报刊或杂志]
ized group of readers
9 opposition 命题的质,肯定的或否
定的逻辑命题的性质
由此可见,质量有多种含义。但是,并非所有的意项都与论文的质量有关。论文的质量与其他物品的质量是有区别的。第一,论文的质量是属于科学领域,它并不遵守价值规律,并非可以用社会必要劳动时间来衡量,而要用对规律的“解蔽”和问题解决的贡献大小来衡量。“除了以富有激情的献身精神去追求以外,没有其他任何事情能使人真正成为专家”,“然而,无论这种热情多么真诚和深厚,再大的热情也不能促使一个问题取得科学的成果这是事实”。[3]第二,物品的质量以最终获取其更高的价格和提高其信誉为目的。而论文的质量却与利益无关,它是以对真理的追求和对问题的解决为目的的。第三,论文的质量应当是间接地与人发生关系,它要通过相应技术转化和扩大推广才有可能进入市场,而物品的质量却与人休戚相关。所以评价学术论文的质量要与日常物品的质量加以区分。从以上辞典中所释各义内涵看,第(6)(7)义与论文质量无关,应予以排除。
(2)学术论文质量的五个维度 著名的科学社会学家劳丹认为,理论的发展主要前提是解决问题。(劳丹《进步与问题》),由此可见解决问题是科学理论的主要目的。那么,按照解决问题的途径可将论文质量的评价标准分为五个维度,其内部结构如图1。
图 1
1)吸纳力 指该理论对已有理论成果或证据的可接受程度,是能解决问题的多寡度。
2)创新力 指该理论提出的观点历史上没人提出或是对旧观点的新阐释以及对新领域的预先探索,亦或是提出了解决问题的新角度。正如齐曼所说的:“最重要的是,科学工作必须含有独创性的因素。每个研究人员的目标是作出发现。”[4]
3)解释力 它包括自足力和预见力。自足力指对问题的解释说明力。预见力是指通过该理论能预见未来问题的准确度。
4)时间性 即历史性。问题的解决只能在相应的即当时的历史背景下即第三种知识的背景场下进行[5]。牛顿万有引力与爱因斯坦的相对论在庞杂程度上自不可等量齐观,然而,在当时历史背景下,其影响力却也是与之不相伯仲的。
5)客观性 是对问题解决的客观事实尺度。它包括事实的验证和理论的证实。齐曼认为:“原始论文在认识论上极少能够完全满足。”“我们关于学术科学模式的本质是:知识的鉴定是一个社会的过程,在这个过程中,每一个科学家的研究结果在经受其他科学家所作的批判性的评价之后,才能被认为是‘充分确定的’。”[6]
这五个维度是有区别的。前四个是前验评价,第五个是后验评价。它们又是紧密联系的。创新力与解释力是方法与目的的关系。创新并非只是提出一些新奇的概念,而是指提出的观点和理论能够拥有对某一问题的良好解释力。吸纳力与创新力是基础与方法的关系。所谓的创新也并非是凭空捏造,而是在前人已解决问题的基础上,吸收新事实、材料、观点的过程。解释力和吸纳力的关系是目的与基础的关系。并非自己一己之力就具有强大的解释力,而必须建立在前人的工作之上且必须接受他人研究成果的证明。同时,每一维度都是历史性的,与时间性维度有着密不可分的联系。
3 旁征博引为哪般——关于引用目的论的分析
关于引用在不同的历史时期对之有不同的看法,它大致可以分为两个时期:第一时期是“阐魅期”。20世纪60年代基于对先知的质朴信赖、追溯已有成果的迷人魅力,被尤·加菲尔德博士称之为是对先行研究的“献辞”;第二时期是“祛魅期”。20世纪七八十年代引用的目的发生了转向,由“尊他”转向为“见我”,成为为作者文章服务的手段。正如拉图尔(B.Latour)所言引用是支持自己主张的说服力之源[7]。著名科学社会学家齐曼认为引文是“作为关于事实和理论的可信的来源而被正式引证”[8]。日本学者藤垣裕子、牧野纯一郎则认为“引用是强调与其他论文的差异,在其他的论文群中确定有关论文的位置,为此发挥着‘道标’的作用”[9]。而张扬自我却有两种方法:一种是吸纳;一种是排他。依此可将引用大体上分为两类:一类是“敬而表之”式。它包括对他人的蓄积成果的尊敬和对自己已有成果的演发。另一类是“取而代之”式。这类也大体可分为两大类:①砝码型,为自己的观点寻找已有的支持证据或相近观点。这一点体现出学术成果的继承性与突破性的统一。②显衬型即为自己的观点树立攻击的标靶,从而衬托出自己的观点。这一方面充分体现出论文的破与立的统一,在祛除“非我”的同时,“自我”也得以体现。
另外,从引用的动机看,引用也大体说明了作者想证明自己在这一领域有专门的研究和一定的发言权。L.埃格希、R.鲁索将引用动机分为:①时新尺度;②否定信任;③操作情报;④说服力;⑤肯定信任;⑥向读者通报文献;⑦社会舆论[10]。动机是目的的主要内容,它直接反映着目的。论文在一定时期的引用率包含了以上七方面的内容。⑥⑦反映的是时间性的维度;①反映的是创新的维度;②③⑤反映的是吸纳力的维度;④反映的是解释力的维度。但是,我们同时也会看到:它并没有包含第五个维度——可检验维度。另外据统计“引用特别多的论文大多出现于该集团对新领域系统研究之初”[11]。它说明了引用度对时间性的强调也非常的突出,然而,质量虽然强调时间,但只把它当作背景来强调却没有走上“前台”。这又是两者的区别。
本文认为:引用率不能代表论文的质量高低,而只能表示该论文的“代表度”,所谓代表度是指论文在特定的领域中代表能力的强弱。当我们谈到相对论时自然而然要想到爱因斯坦的广义相对论与狭义相对论。当我们谈到宇宙起源时自然想到宇宙大爆炸理论,这并不是表示爱因斯坦的相对论要比宇宙大爆炸理论质量高或低,这只能说明某一理论在各自的领域内具有一定的权威。它不同于质量,质量是好坏的标准,而代表度是强弱的标准。同时它也是一个历史的概念,它只表示在某个特定的时期在某一领域的代表性。
由此可见,论文的引用率并未完全重合于学术论文质量,那么在现今能否采用SCI作为评价标准呢?
4 关于SCI作为基础研究成果客观评价标准论争的评析及当前采用SCI作为评价指标的必要性
近年来人们围绕着SCI对我国基础研究的影响问题,展开了热烈的讨论,看法颇有分歧。有学者认为不能把SCI作为评价学术论文的标准,原因①SCI对非英语国家的论文的引证统计差错严重[12]。②科学研究具有自己的规律,科学家才有专业认知能力,科学成果必须由同行评价(注:美国自然历史博物馆古生物部研究员孟津博士的观点。)。③形成淡化对真理的追求,强化了功利性[13]。④集中向国外投稿容易形成“墙里开花墙外红”的现象[14]。⑤SCI是简单的非科学的方法[15]。也有学者赞成用SCI作为对学术论文的评价标准。其原因如下:①科学家具有一定的自律性,能够不放松对科学规律的追求[16]。②行政管理人员认为不能找到比SCI更好的可以量化和进行“公平”评价的标准[17]。③可以提高中国科研成果的国际地位和影响。④SCI源期刊具有严格评议和学术民主的特点[18]。⑤利用SCI有助于加强道德自律[19]。⑥利用SCI有利于调动教师积极性[20]。由此可看出其争论是围绕以下四对矛盾展开的。
第一,内行与外行的矛盾。即把同行评价当作内行的评价,把行政管理人员用SCI评价当作外行评价。其实,SCI也体现着同行评价的因素。其运行机制是:期刊编委评价——刊载(IF体现)——大同行评价(引用率体现),但其中也不乏外行的因素,即行政管理者大多不是专门领域的科学家,但也可以说其是内行,因其采用的根据大都是内行作出的(期刊编委评价基本是小同行作出的,刊载后的评价是大同行作出的)。
第二,科学家的自律性和功利性的矛盾。科学家本身是一个矛盾的集合体。一方面,其事业是客观的,对此应是无私利的,应为科学而科学。另一方面,科学家又是社会成员,其行为又受到社会政治、经济,特别是价值规律的影响。不可避免在一定程度上受一定经济目的、社会荣誉的诱惑,这是由其自然本性决定的。
第三,科学成果的国内化和国际化的矛盾。出现这一矛盾的原因在于:由于注重向SCI国外源杂志投稿,从而使国内优秀稿件减少,以及在国内宣传力度降低。同时由于语种限制,严重影响中国学术论文的被检索机会。然而,这种缺陷对所有的中国学者都是相同的,所以就不存在公平与不公平的问题。科学知识不存在特殊权益的根源,无论是国内还是国外的学术成果都是人类成果之一滴,重要的是能否形成一条国内外学术成果自由交流、及时反馈的“绿色通道”。
第四,公平性与便捷性的矛盾。科学家强调公平性而行政管理人员强调便捷性。实际上两者并不矛盾,公平是以快捷为前提。如果不能对学术成果的优劣在可能的时间内进行迅速、快捷的判断,而只是用漫长的时间来检验,恐怕这将是对每位科学家特别是作出突出贡献的科学家的不公平。而快捷性是以公平为基础的。快捷并不是否认公平,而是运用公正的指标进行的。SCI在一定的水平上能够体现公平性与便捷性的统一。
归根到底,引用率与学术论文的质量是一种质与量的关系。量虽然不绝对等于质,但是它却反映质的精确性。正如乔纳森·科尔和斯蒂芬·科尔指出的:“定义质量的方法有两种。一种是按传统的绝对的标准评价进行定义。另一种是采用与绝对定义相反的社会定义。”[21]前一种是以真理的揭示度为指针,后一种是以现实的实用为标准。“这种定义依据的哲学观点是,没有绝对真理,真理是由社会决定的。”[22]美国学者M.W.瓦托夫斯基也认为量化标准“不是事物或事物间关系的一种内在的和可测量的属性——它取决于测量的目的。”[23]由此可见,用SCI对基础研究成果质量的评定在于激发基础科研人员的创作热情,加速我国基础科学研究与国际研究接轨。基于此,本文认为:在我国当代采用SCI作为评价标准是极其必要的。
(1)时代和国情的要求 当代学科分化日渐复杂,学科“杂交”渐成大势。某一地区甚至国家中在一基础科学学术领域的科学家数量有限,能够称得上是“纯”同行专家的更是少之又少,这样就造成某一地区、国家由于缺少完备的专家团使同行评议的内部机制不健全,使同行评议的理论和实践相背离,不能有机结合。
网络技术的普及使信息的产出、传播速度迅速提高,这就使运用SCI进行评价成为可能,且是一种理想的选择。因为它可以在短时间内且随时通报国际同行专家对某一篇论文的评价,既方便且快捷。
中国社会家族观念强,主张以和为贵,注重人和人之间的协调关系,从而形成了一种相互依赖的顽陋习惯,特别是权威依赖现象特别严重。这种传统伦理道德使同行评价在我国顺利开展变得步履维艰。
(2)同行评议有其内在不可解决的缺点
主观性强 同行专家都有自己的一套世界观和方法论,甚至他们的学识、年龄、心理等都会对评价产生不可忽视的影响。并且,由于同行专家数量有限,这种影响就变得极为重要[24]。
易排外性 同行评议容易扼杀独创的、反权威的“非共识”的研究成果。其原因在于同行专家因各自都有牢固的思维范式,对于反常性见解一般都会加以排斥。当今的社会归根结蒂是一个创新的社会,科学技术的高度发展是建立在高度发达和无数勇敢的探索性劳动基础上的。惟以建立在先人基元上的创见才赋予自身生存的意义。
难与规制性 这是指由于所在地区狭小,不可避免评审专家由于情感原因对某一研究成果形成偏好。尽管可以采取回避制等补救措施,但是却无法克服评审专家与被审研究成果的内在全部联系。同时由于现今中国关于同行评议的法律和法规尚不健全,难以规制同行评议中的违规操作。
基于此因,本文主张建立一种三层动态制约机制来完善SCI对学术论文质量的评价。其结构如图2,以SCI评价为基础,虽然SCI评价并没有体现时间、客观事实两维度,其中也不乏“马太效应”的驱使。但是通过实践人们发现,引用率确实在一定程度上能反映同行评价的特征,其结果大体上与同行评价的结果相同,也就是说它基本上能反映出学术论文的真实质量,其不足可以通过国内专家评审团根据各门学科的内在规律在一定的时段内用事实去加以检验。行政评价应在此基础上根据具体的国情和面临的具体问题作出。此外在市场经济日益充斥的时代,面对市场经济中出现的种种诱惑应当大力弘扬以默顿规范为核心的科学精神,通过制度建设来“自下而上地(而非自上而下地)重建作为一种文化心态(而非治国)的社会公德”[25]。
图 2
当然对于论文质量进行客观评价的问题是一个深刻而繁琐的工作,它需要科学工作者、行政管理人员及编辑人员等多方的共同努力才能够达到。其中如何能够体现解释力、创新力、吸纳力以及时间等维度的权重比例,如何把外在事实评价引入SCI,如何能实现客观评价的“本土性契合”,是我国学术成果评价中亟待解决的问题,还有赖于科技人员的进一步探索。
(对各位老师在我写作过程中给我的悉心帮助,再次表示由衷的感谢。)