关于社会科学文献引文分析理论的思考,本文主要内容关键词为:引文论文,社会科学论文,文献论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
文章着眼于引文分析的角度,对社会科学文献与自然科学、技术科学文献的诸多不同特点进行了剖析,并在此基础上探讨了如何建构有特色的社会科学引文分析理论与方法体系。
引文分析理论在揭示文献间的联系程度、方式、特点及规律等方面具有独特的作用。经过几十年的研究与探索,这一理论已日趋完善,并初步显现了广阔的应用前景。然而,这一理论的诞生、发展及不断修正,几乎都发生在自然科学和技术科学领域,真正从社会科学文献的特殊性出发,系统全面地将计量学原理与社科文献的引文特点相结合的论著还很鲜见,这不能不说是引文分析理论的一大缺憾。
一
引文分析理论的宗旨是准确深入地揭示文献间相互引用的规律,并应用这些规律来分析繁杂纷呈的文献流现象,创造出适宜社会需求的情报研究成果。实现这一宗旨的基本前提是准确的定性和精确的计量。这就需要一系列相应的基本概念和量化测度。而这些概念和测度能否客观深入地反映文献间相互引用的规律,关键又在于能否深入把握不同文献的引文特点。仅仅将引文分析的一般(或曰传统的)概念与测度套用于各类文献中,是无法实现上述宗旨的。对于社会科学文献来说,尤为如此。
社会科学文献的引文现象至少有以下基本特点:
其一,引文的动机复杂多样。与科技文献的引文动机相比,社科文献的引文中,用于参考和利用前人、他人学术成果的,只占居其中一少部分,还有大量的论据性引文、叙述性引文、反驳性引文、修辞性引文、酌谢性引文、声势性引文广泛分布、融合在各类学科各种文献之中。另外,社会科学家对社会问题的态度、政治倾向和情感影响科研的强度远胜于自然科学家,致使他们在选择利用文献情报时带有明显的主观色彩及政治和意识形态倾向。[1]
其二,引文的限制因素较多。社科文献引文除了受引用者的客观条件和主观心理因素的限制外,还常常受到社会意识形态因素和语种因素的限制,即使在研究中吸收、借鉴了对立意识形态方的思想、观点和方法,许多人也不愿明确地标出引证文献,进而影响到社科文献引文中的外文引文数量与文种大大低于科技文献引文。
其三,引文的延伸性极为普遍。即研究者引用某一文献并不是汲取原作的本意,而是“借题发挥”,表达自己的观点。在社科领域中常常会出现不同的研究者引用同一文献甚至同一段落的文句,而引伸出互不相同、甚至互为相左的观点和结论。这在引用经典文献中表现得尤为突出。
其四,引文的隐蔽组合性突出。社科文献中著作林立、成果繁多,但其“专利性”却很差。有相当多的专著和论文是将众多的引文通过隐蔽的形式(以不同的语言风格、表达方式阐述同一思想和观点)组合而成,没有作者独特的发现。至于那些以拙劣的手法照搬别人的论述,“拼七巧板”而成的“研究成果”更是比比皆是。
其五,无引文标识的文献众多。以学术论文为例,国外科技期刊90%以上的论文附有引文篇目,国内科技期刊论文附有引文篇目的亦达88%[2],而我国社会科学期刊论文附有引文篇目的仅占54.32%[3]。这与社科研究对文献具有更强的依赖性是极不相称的。
其六,不被引的文献颇多。社科领域中有大批的文献仅以“被发表”而走到了生命的终点。甚至有多种期刊在相当长的历史时期内未能走出“不被引”的窘境。据美国情报学会彭德尔伯里(D·Pendlebury)对1984年发表的论文、1988年被储的引文为对象调查表明,社会科学论文非被引文率达74.7%,其中艺术及人文科学类论文非引文率更高达98%;而数学、物理学、化学、生物学论文的非被引率则分别为55.5%、36.7%、38.8%和41.3%,医学和技术类论文的非被引文率分别为46.4%和56.2%。[4]虽然不被引的原因是复杂的,但它毕竟鲜明地折射出了社科文献的“情报冗余量”高于科技文献这一客观事实。
此外,社科文献引文半衰期长、学科关联度广等特点亦早被众多的情报学研究论著所证实。
面对上述特点,现有的引文分析理论是难以进行有效的量化反映的。因而,引文分析理论还需积极开辟其分支领域——社会科学文献引文分析理论与方法。
从我国目前的实际情况看,建立社科文献引文分析理论不仅是必要的,而且是可能的。首先,引文分析理论的引入和应用已有15年的历史,在我国图书情报界已十分普及;其次,出现了一批文献计量学专家及一批运用引文分析理论分析社会科学文献的论文;再次,一些著名大学建立了社会科学情报学方向的硕士研究生教研机构,引文分析理论已成为其教学科研的重点学科之一;最后,国家哲学社会科学研究“九五”规划已将“文献计量学”列入重点课题之列[5],而“社科文献引文分析理论与方法研究”则自然而然地成为其“重中之重”的研究内容。
二
建立社科文献引文分析理论,首先应将社科文献引文特点与广义的引文分析理论有机地结合,确立一系列基本概念,作为整个体系的基础构架。
引文分析仅仅以“所有的被引文献具有同等的重要性”为假设,依据引文的数量去揭示文献的学科、载体、时限、语种、著者诸方面的内在规律;显然是比较肤浅的。目前人们愈来愈重视对引文动机的分析与研究,并试图将引文动机与引文数量有机地结合,进而揭示文献流的深层规律。这相对于引文动机更为复杂的社会科学文献来说,尤其是一条必由之路。这里,笔者将社科文献较为复杂的引文动机(不包含非正当的引文动机)归纳为以下七种类型:1.参考引文——为了吸收他人的理论观点、研究方法而引用的文献;2.论据引文——为自己的论点提供事实、数据等依据的引文;3.叙述引文——为了将目前的研究课题同以前的研究成果联系起来而引用的文献;4.反驳引文——为了批评或否定他人的理论而引用其人论述的引文;[6]5.修辞引文——为了增强论述的文采而引用的文献;6.酌谢引文——对某一研究课题的开拓者表示尊重、承认其研究成果的优先权,并表示感谢的引文;7.声势引文——以他人(通常是著名学者)的言论来证明自己的论点正确的引文。上述七种类型的引文“对著文的支持作用是不同的”。[7]参考引文体现了他人科研成果的社会效益,具有很强的思想启迪与指导作用;论据引文则是支撑论点的必备材料;叙述引文反映了学术研究的继承性;反驳引文的主要作用则在于使引用者有的放矢、有破有立;修辞引文可增强文章的可读性及鲜活的色彩;酌谢引文则仅仅是为了对先躯者表示敬意;而声势引文也只是为了表达“英雄所见略同”的意思罢了。如果以研究者引用文献对自己的研究内容所起的重要作用来权衡以上引文的话,它们的权重应是依次递减的。这将是计量分析时所必须考虑的测度问题。
此外,不同形式的引文同样对社科文献的质量产生着不同的影响。1.直接引文和间接引文。前者是指研究者直接地引用原始文献,具有较强的可信度,自然对文献质量具有可靠的保障作用;后者一般是研究者因客观条件限制而不得已采取的引文方式,当然也不排除个别研究者出于“省力原则”的驱动而为。[8]但无论出于什么原因,相对直接引文而言,它对论文质量的保障作用均已打了折扣;2.显性引文、隐性引文、延伸性引文。显性引文是指明确地采用引号来引用的文献。这类引文与原始文献中的字、句、标点符号是完全相同的,具有很高的准确性;隐性引文是指文献中虽有“××说”、或“××指出”之类的引导语句,但只是撮述其原文的大意,并非精确地引其原文,这类引文的可靠度不如前者;关于延伸性引文,笔者在文前论述社科文献引文特点时已作了表述;3.自引。分为“著者自引”、“期刊自引”、“学科自引”、“流派自引”、“语种自引”和“区域自引”等等。[9]其中每一种自引又可分为若干种类型,分析内容十分丰富。尤其是“著者自引”的统计与分析,已成为引文分析理论中争议较大的热点问题。就社科文献引文分析理论而言,将自引现象分析与引文动机分析有机结合,就有可能对“自引究竟是表现了科学本身研究的连续性?还是表示作者自我吹嘘,眩耀自己学术成果?”[10]作出比较准确的判断;4.确切性引文和误差性引文。前者是科学文献的基本要求,无论直接引文、间接引文、显性引文、隐性引文都应保证确切。“然而,不管怎样,作者们将继续在引文中出错,这是无法避免的。”[11]因此,误差性引文已成为科学文献中时常出现的问题,进而使之“几乎对建立在引文基础上的一切活动都有影响。”[12]社科文献中除了引文书目信息误差等“细小的错误外”,还存在着相当多的引用原材料的错误或不恰当等“严重的问题”,尤其是近些年来出版的某些“辞典”、“大全”、“指南”、“手册”、“文库”之类的工具书中,以讹传讹的现象相当普遍。所以,对“引文误差”的研究理应成为社科文献引文分析理论的重要内容。
由于被引文献的学术层次不同,它们在社科文献中所起的作用也不相同,仅以“被引频次”或“被引率”来笼统地评价被引文献,肯定会失之偏颇。目前在一些学科中通过“被引率排序”的传统方法所确定的“核心期刊”与客观实际很不相符,其原因就“在于不应该把学术类、技术类、科普类期刊混在一起排列。”[13]同样,社科文献中不同类型的引文也不宜混在一起计量分析,而应区别为“学术性引文——科普性引文”,或“理论性引文——宣传教育性引文”,然后再按类别进行计量排序,以便从引文深度方面客观地反映被引文献的实际情况。
在对引文深度进行类分的基础上引入“高频引文——高频被引文”、“中频引文——中频被引文”、“低频引文——低频被引文”“未引文——未被引”,以及引文对著文主题的高、中、低相关度等一系列概念,[14]就可更加深入细致地对社科文献引文现象进行计量分析。通过对高、中、低频引文的分析,可以揭示社科文献对他人或其他学科科研成果的汲取程度,也可揭示对原始资料的占有和利用程度;高、中、低频被引文可以反映被引文献的学术价值或资料价值;而引文对著文主题的相关度则可有效地分析引文与著文的联系程度。至于以什么样的标准作为高、中、低频的界限,则需通过大量的引文分析实践后,根据社科领域中不同学科、不同专题的特点而分别确定。
三
社科文献引文分析理论体系的另一大基础构架便是与其基本概念相适应的量化测度。
目前我国社科文献引文分析论文大都仅利用了很少的一部分量化测度,这与社科文献引文复杂的内容和方式是很不适应的。因此,社科文献引文分析理论的建立和完善,还有待于广泛深入地运用丰富的量化测度。
传统分析项目应注重从以下几个方面进一步深化:1.学术流派引文量、引文率、被引文量及引文偶合频次、同被引频次的分析。由于社会科学是“以文献或以人为性和不可重复性为特点”,[15]加之理论的检验大都须经过长期而复杂的实践过程,因而常常形成对社会现象的不同认识,进而形成不同观点、不同的学术流派。正是不同流派间的认识方法、研究方式及理论观点的不断碰撞、融合、分离的循环往复运动,促进着社会科学的不断发展。[16]各种流派的兴衰史无不深深地反映在社科文献引文之中,对学术流派的引文情况进行量化测评与分析,是探求社科文献引文规律的不容忽视的角度。2.非被引量的分析。在一定时期内,一次都没有被引用的论文或论著称之为非被引文。社科文献的非被引率明显高于自然科学和技术科学文献。对此,社科文献引文分析理论应从不同学科、流派、著者等众多的角度去测评与分析,进而以量化数据来揭示社科文献中复杂的“情报冗余”和“水份”现象。3.不同学科、不同主题的同被引频次和引文偶合频次分析。同被引频次和引文偶合频次是反映文献之间联系程度的重要指标,这种指标不仅仅从微观上反映了某篇文献与其他文献的关联程度或某些文献以共同拥有同一“中介”性文献而产生联系的程度,更重要的是从宏观上反映了社会科学强烈的交叉渗透性以及不同主题间复杂、广泛、深入的联系,甚至还反映了社科文献引文的“马太效应”程度等等。然而,目前的社科情报学论著则很少有对这类问题的量化研究。
在当代分析项目方面,社科文献引文同样有着丰富的量化测度待我们去研究与运用。1.文献因子。这主要是用于评价期刊文献的一系列计量指标。其中“影响因子”“旨在纠正原始引证分析只重被引次数而忽视其他因素(如期刊的周期、篇幅、内容范围等)的不足,力求使引文分析科学化”。[17]对于社会科学期刊而言,由于引文目的的复杂,加之受意识形态因素影响较大,因而仅以“影响因子越高则期刊质量越高”来笼统地评价期刊是不适宜的,必须细化为“每篇被引用文献的影响因子(PCI影响因子)和“能够引用及被引用文献的影响因子(CIC影响因子)”[18]、“自影响因子”(某期刊“研究峰值”年度内自引数/“研究峰值”年度内该刊论文总数×100%)[19]等等,以便从不同的角度来综合评价期刊的质量。另外,通过引文因子(某期刊某年度引文总量/该年度该刊被引总量)、名望因子(某年度所有该学科期刊引用某刊论文数量/该年度该刊所引用该学科期刊论文数量)、消费因子(引文因子×名望因子)等文献因子的测评,亦可深入分析社会科学期刊文献是否位于学科前沿及被纳入知识领域的速度和程度,进而客观地判定期刊的硬度。[20]2.文献的引用、被引用率。根据社科文献的特点,应着重测评其高频被引论文占有率(高频被引论文篇数/总论文篇数×100%)以及相对应的未被引论文占有率(超过一定时间后某期刊未被引用的论文数/该期刊论文总数×100%),以从深度方面来衡量社会科学期刊的质量。[21]若将引文动机中的七个定性概念引入,即可分析“高频被引论文”中哪些是真正具有较高学术价值的,哪些是“马太效应”及其他因素所致,进而更加切合社科文献引文的特殊性。此外,对转引率——被转引率的统计分析,同样也是评价社科文献科学严谨性的一项重要指标。3.文献系数。其中引证系数(某种或某类期刊引用另一种或另一类期刊的总次数/该种或该类期刊被引用的总次数×100%)可以从两个不同的侧面反映出各学科文献间的引证关系。恰恰适应“社科文献内容间的多维关联性”。[22]而声誉系数(如某学科的期刊的声誉系数=引用期刊种数/该学科被引用的期刊种数)则又对社会科学文献的评价增加了一个独特的视角。
同样,论文、论著的响应时间(从出版到第一次被引用之间的时滞)则从文献效果的及时性和有效速率的角度揭示了社科文献的质量。而引文链分析则将社科文献间“承袭”和“联姻”情况,形象而量化地呈现出来,更利于对社会科学“辨章学术、考镜源流”。
四
社科文献引文分析理论除了构建起“定性概念”和“量化测度”两大基础框架外,更重要的还在于将二者有机地结合,形成系统的理论体系。而贯穿于这一理论体系的始终,将定性与定量紧密联结的媒介便是社科文献引文的最基本特征——复杂多样的引文动机。
将参考性引文、论据性引文、叙述性引文、反驳性引文、修辞性引文、酌谢性引文、声势性引文作为社科文献引文分析理论体系的基本要素,融入各类“定性概念”和“量化测度”中,既可深化引文的学科、载体、时限、语种、著者、形式、频次、因子,以及共引聚类、引文行为、引文链等众多的理论分析,又可以丰富诸如经典文献及核心期刊测定、学科间联系程度的测评、学术带头人评鉴、学术思想发展历程追踪之类的应用内容,真正适应社科文献强烈的社会性、与语言联系的密切性、情报流速的缓慢性、内容间的多维关联性、分布的广泛分散性、利用价值的隐蔽性等特点。[23]因此,为了提高社科文献引文分析的测度意义和评价能力,“有必要把每条引文对著文的支持作用清晰地区分和反映出来,使引文分析测度参数的形式和内容在测度效果上更趋一致,以求准确地反映知识被利用的深度。”[24]
此外,还可以依据上述七类引文的同被引数据,来深化社科文献的同被引聚类研究,来分析文献、作者、期刊、学科在结构上的网络关系。[25]以反映社科文献的知识结构、主题内容及相关学科等重要的情报学内容。
当然,分别依据七类引文的高、中、低频被引数据,深入进行社科文献的自引率、既时引用率、被引证系数、名望因子、消费因子、论著论文响应时间、期刊平均响应时间及引文链等情报分析,同样可以探求一系列社会科学文献流的特殊规律,进而为测评各类社科文献的学术价值、理论水平、文献半衰期,为制定科学的文献收藏体系、定题资料服务体系,为客观地评价研究者的科研进展状况、学术流派的承袭情况,为分析各学科领域的研究热点、争鸣的广度和深度,为分析学科发展趋势,有效地开展三次文献开发与服务提供可靠的根据。
收稿日期:1997.5.24(修订稿)