2006年社会科学文献计量学发展回顾_文献计量学论文

2006年社会科学文献计量学发展回顾_文献计量学论文

2006年社科文献计量学发展回望,本文主要内容关键词为:计量学论文,文献论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

自1969年英国著名情报学家阿伦·普里查德(Alan Britchard)正式提出“文献计量学”(Bibliometrics)这一术语至今,文献计量学已经迅速发展成为图书情报领域最活跃的分支学科,代表着情报科学的主流方向。由于信息技术和网络技术的发展,科学计量学、情报计量学、信息计量学和网络计量学等学科,与文献计量学在理论与方法上相互交融与促进,使以文献计量学的三大经典定律:布拉德福定律、洛特卡定律和齐夫定律为基础的各种定律得到不断的修正和发展。

近年来,我国的文献计量学研究与发展,首先注意从学科建设的角度完善文献计量学的学科内容,从理论、方法和应用三个方面构建文献计量学的学科结构体系。当前的发展趋势,依然是继续深化和完善文献计量学的学科结构体系,同时深入研究“计量学”学科群的体系结构,包括文献计量学、情报计量学、科学计量学等“三计学”的关系问题;此外,在实践中,需要正确处理好科学理论与实际应用的关系。科学的理论指导和正确的实际应用,是文献计量学发展的必要条件。

2006年我国文献计量学的研究与应用仍处于持续发展阶段。文献计量学在社会科学领域的发展还处于借鉴、运用和适应的阶段,突出表现在几个方面:

一、词频分析的应用范围不断扩大

文献计量学是以文献或文献的某些特征的数量为基础,来论述与预测各种现象与规律的情报科学分支。词频分析是文献计量学具有代表性的一种分析方法,2006年度发表的一些研究成果尝试通过分析篇名词、叙词或关键词的词频,来描述学科领域的研究状况。

2006年5月出版的《科学计量学:理论探索与案例研究》一书,对国外最具影响的56位情报学家所发表的2869篇(部)论著进行了题目词频分析,从中离析出各篇(部)论著的研究对象。这些研究对象有一定的广度,涉及7个方面:1.学科,2.区域和国家,3.机构,4.人群,5.信息载体,6.科学活动,7.政策与管理。该书在对“学科”的词频分析中,将某门学科的学科名称和其对应的形容词视为同类词汇,从中找出涉及学科的词汇共有51类,490频次。对其进行词频分析之后可以看出,最受情报学家垂顾的学科是化学,学科名称出现87频次;社会科学和人文科学中受关注最多的是经济学,共计16频次,显然远少于自然科学。词频分析还可以进一步分析出某个学科在哪些方面受到关注。例如化学,词组analytical chemistry(分析化学)出现了21次。再具体分析21篇分析化学论文就可以看出:分析化学领域中的论文产出、研究绩效、引文模式与影响,以及国际合作情况等是主要的关注方面。采用这种方法,可以发现情报学家对社会科学的兴趣主要集中在社会科学的学科结构、科研产出、绩效评价与期刊影响等等层面上。该书还运用词频分析方法,考察了三个国外著名的科技创新和政策研究机构在近年出版的论著目录。通过词频分析,这三个机构的研究思路和方法显而易见,例如,研究对象有宽广的时间跨度、有宽广的学科对象与产业领域,采用经验和理论的多种方法并思考人类的生存与发展等问题。

《河南师范大学学报(哲学社会科学版)》在2006年第2期上刊发了一篇词频分析文章,题名为“人文社会科学研究中高频字词计量分析法的有效性——以中共党代会政治报告为例”。在这篇文章中,作者通过对构成文献的汉字、词语和词组进行分析,从中推断人们的思想和行为。该文认为,如果找出在特定时期频繁出现的特定汉字,就可以搜索到包含此汉字的词汇,将其作为特定的关键词,建立一个共同的平台,对数据进行平均化处理,找出平均的使用频度;通观高频度词语的变化,可以把握研究对象变动的大体情况。该文认为:如果要分析中国共产党这一主体思想的行为亦即方针政策,那么最好收集整理党代会的政治报告和《人民日报》社论等资料,因为它们具有分析对象所需要的量与质的稳定性,以及时间跨度的规律性。分析高频率汉字出现的变化情况,可以对中国现代史的分期与特点有大致的了解。例如,九大到十一大的统计数据显示出时期的极大差异,如“阶”、“级”、“革”、“命”、“主”、“义”等这样的字在那一时期极为突出,反映出“文化大革命”时期的特征。从汉字的表意性特点出发,寻找包含此汉字的词汇,有可能发现关键词汇。另外,通过特定的汉字群的表现方式的变化,也有可能发现某一时期的特征。我们只要通过对汉字元素的成分分析,就能够理解文献内容的大体特征。这是在表音文字的书面语言中绝对无法想像的。

在分析汉字的基础上推衍词语和分析词语是该文研究的重点。复合词语不是单纯词汇的集合体,而是作为复杂概念的表现而被创造和使用的词语,因此有时就会因为被复合而使原义变化。该文认为,了解复合词语的使用状况就可以理解更为具体的变化实态,如,通观文中复合词语出现的频度可以解释中国共产党政策的变化过程。汉字特有的表意性质和基于这一特点的分析方法今后会得到积极的利用。

词频分析中的共词分析法属于内容分析法的一种,它通过对一组词的两两统计,找出其在同一篇文献中出现的次数,并以此为基础对这些词进行聚类分析,以求反映出这些词之间的亲疏关系,进而分析这些词所代表的学科和主题的结构变化。70年代中后期,法国文献计量学家最早提出共词分析法这个概念。1986年,法国国家科学研究中心(CNRS)的两位学者出版了《科技动态映像》(Mapping the Dynamics of Science and Technology)一书,成为共词分析法的重要里程碑。共词分析法的主要内容集中在聚类和数据可视化方法上。聚类方法除了统计方法中的多维标度、聚类分析法外,还有基于共词矩阵的包容性指标、临近性指标等值系数指标,并按照指标值从大到小进行人工分类的方法。可视化方法是将类目之间的关系用图形方式直观、形象地揭示出来的方法。目前共词分析的主要可视化方法包括包容图、临近图、战略坐标图等方法,多维标度的结果也可以直观地表示类目之间的关系。

《情报学报》在2006年第4期上刊发了题为“1995~2004年文献计量学研究的共词分析”的文章。在这篇文章中,作者利用LISA数据库,对1995~2004年全世界文献计量学领域发表的期刊论文进行了共词统计,结果共得到1995~2004年的数据2387条,11560个叙词,之后分成1995~1999年的86个叙词的共词矩阵和2000~2004年的113个叙词的共词矩阵。分析结果表明:1.研究范围进一步拓展。从两阶段中新类团的增加、类团关系的变化以及第二阶段的聚类效果没有前一阶段好这些特征来看,可以认为文献计量学这个学科正在经历着从稳定到不稳定的过程,也就是说正在发生结构性变化。总体结构从“期刊论文的引文分析”、“科技生产率和科研评价”两个核心变为一个“期刊论文的引文分析”核心;而新兴的“网络计量学”、“电子文献使用分析”成为第二阶段的次核心;科学计量学的核心主题“科技生产率和科研评价”消失后,“作者生产率”、“大学合作”、“作者合作”三个类团形成一个稳定的、联系密切的三角形。这个变化从侧面说明了科研评价主题出现弱化趋势。2.研究对象出现多样化趋势。近五年来,文献计量学研究的主要范畴除了原来已有的“期刊论文的引文分析”、“引文库”、“馆藏发展”、“增长与老化”等内容以及属于科学计量学范畴的“国家生产率”、“作者生产率”、“合作研究”、“比较研究”等内容,又新增了“网络计量学”、“电子文献使用分析”、“学术出版”、“用户分析”、“人文社科”等主题范畴。除对传统的纸本期刊进行分析以外,对网络空间中的文献定量研究工作逐步展开。该文作者根据战略坐标图的分析认为,“期刊论文的引文分析”在文献计量学领域中处于不可动摇的核心地位;科学计量学的研究核心从“科技生产率与科研评价”变为以“合作”为主题的“作者合作—作者生产率—大学合作”;“网络计量学”引起了足够的重视,它与文献计量学传统领域的联系很强,但是内部的研究还不太成体系,该领域的主题有进一步发展的空间,具有潜在的发展势头。

二、学术期刊评价研究继续扩展

学术期刊研究在文献计量学领域占有举足轻重的地位。由于期刊论文在时间和数量上存在着一定的规律性东西,文献计量学一直把期刊作为重要的统计源和研究对象,而对学术期刊的评价是文献计量研究的重要领域。

期刊的质量和影响是科学评价的重要指标之一。在科学评价指标体系中.发表科研成果的期刊的学术影响是一个重要的指标,也就是说成果的水平由可以参考期刊的水平来衡量。目前,对于刊物的学术影响或水平的判定,比较多的做法是以核心期刊的标准来判断。20世纪80年代以来,我国的文献计量学的理论与方法被越来越多地应用于测定核心期刊。从学科角度评价期刊体现了核心期刊的应用价值。例如:北京大学图书馆与北京高校图书馆期刊工作研究会联合编辑出版的《中文核心期刊要目总览》(2004版)即第四版,评选出1800种核心期刊,分属7大编75个学科类目;中国社会科学院文献信息中心完成的《中国人文社会科学核心期刊要览(2004年版)》评选出344种核心期刊涉及25个重要学科,它们都是利用文献计量方法从学科应用角度研制完成的。文献分散定律认为,科学的整体性原则反映了科学知识纵向的继承发展和各个学科专业横向的渗透联系,这是由学科在发展过程中的交叉融合决定的。学术论文及其引用在期刊中的高度不均匀分布体现了学科的分化过程,也体现了核心期刊的学科性与集中性。

目前比较公认的核心期刊评价方法是综合评价法:1.定性评价与定量分析相结合;2.多种指标相结合。3.分学科或研究领域的分类评价与多领域或跨学科分析相结合。武汉大学中国科学评价研究中心对评价指标、指标权重、评价模型、评价方法以及综合指数评价法的合理性进行了研究,提出了“综合指数评价法”,认为评价期刊的指标是来自该刊全部论文的统计数据,因此,评价期刊的质量指标值(也称为“质量指数”)也是该刊论文的平均指标值。“综合指数评价法”采用数理统计的分类方法:一类标准的概率为15%,为核心期刊范围,二类标准的概率为25%,其余为三类。采用多指标相结合的评价方法,一般要经过选择和确定指标、给出指标的权重和建立综合评价模型这样的过程。核心期刊被赋予学术评价功能之后,某些实践中不恰当的应用带来一些负面效应,存在诸多非议。而核心期刊的评价功能是有它合理性和积极意义的:它可以促进期刊之间的规范竞争;为学术论文评价提供一种简便快捷且客观公正的工具;同时还有利于作者提高论文质量。因此,应理性思考如何克服核心期刊评价功能的缺陷和弊端,使核心期刊得到合理科学的理解和使用。

国内还有两家电子期刊提供商(中国学术期刊光盘版电子杂志社和万方数据公司)也统计了期刊的多项指标。2006年学界出版了一些相关的评论性文章与专著,作了多方面的探讨。由于引文数据有相对的滞后性,有些科研管理部门把重要的文摘刊物的摘转量也作为评价指标,但是对摘转量指标的研究与分析还未见到较好的分析文章。

对于目前盛行的期刊量化评估方法,也有不同的观点。有的学者认为,在所有的量化评估中,人们都立足于一个尺度上看待所有的学术成果,不注重分别学科之间的差异性,同一学科研究类别的差异性,以及同一研究类别中文章性质的差异性。衡量这些论文的价值大多只考虑到发表刊物的档次差别。克服这种简单化的做法,应该引入“级差学术”的理念:在学术评估中尽可能运用客观的、可统计的方式界定学术成果的“级差”序列,从而使学术的量化评估尽可能地体现出学术操作难与易的差异,体现出学术成果发表途径多与少的分别,从而使学术评估体现出更多的公正性。“级差学术”的理念来源于经济学的“级差地租”概念,以及之后移作有关等级差别的规范性表述,如“级差管理”、“级差工资”。学术评估中引进学术级差理念,是把成果实现途径的多与少作为基本参数,对学术成果进行适当的、富有说服力的学术级差的分辨和评价。具体地说,可以将各个学科研究人员的大致总数与现有学术期刊对于各个学科每年可能的发稿量计算出一种比值,形成各个学科发表途径难易度的级差参数,再结合各个学科原创性成果每件所需劳动量,特别是在思想性构思之外的操作、调查所需的硬性劳动量进行综合考察,制订出学科之间的难度级差权重,在量化统计的时候将这种难度级差的权重核计在内,以求得到尽可能合理的学术公平。这种难度级差的认定需要建立合理、公正的统计模型。目前学术评估似乎已经注意到了“水平级差”和“影响级差”的问题,但“难度级差”则远远没有得到关注。

三、引文分析的研究与应用继续深入发展

引文分析是目前文献计量学、科学计量学和网络计量学中最活跃的研究领域之一,在期刊评价、科研效绩评价、图书馆文献资源配置和信息服务、科技管理以及学科建设等领域得到越来越广泛的应用。

《现代情报》2006年第2期的“我国近年引文分析研究论文的计量分析”一文,利用重庆维普资讯公司“中文期刊全文数据库”网络版所收录的2000~2004年引文分析研究方面的539篇相关论文进行分析,测度国内该领域的研究现状和发展趋势。在这539篇相关论文中,有核心期刊论文270篇,占统计总量的50.1%,并且各年核心期刊论文量占到当年论文总量的一半左右。根据普赖斯在学科进入大发展时期,文献量迅速上升,而当学科理论日趋成热时,论文量增长减缓并有一个稳定时期的推断,我国引文分析研究在90年代经历了从缓慢发展阶段到大发展时期,从90年代末期开始到21世纪初,该领域研究进入了一个相对稳定期,且向着数字化、网络化和多元化方向进一步发展。

上述539篇论文分别刊载在285种期刊上,分布相当分散。在非图书情报类期刊中,科技期刊所占的比重最大,约占刊源总数的43.2%,其论文量也占到论文总数的1/4,其次是大学学报占29.8%,其它社科类期刊比例最小,约占8.2%。图书情报类期刊仍然是发表引文分析研究成果的主要刊源。此外,合著率的显著提高,表明近年来的某些引文分析成果需要有合作者才能更好地完成。较长期从事引文分析研究的人员数量并不多。多产作者93%来自高校图书馆和信息管理系。从上述5年间引文分析论文所研究的对象分布看,单一期刊评价占49%,分析理论与方法占14.2%,某类期刊评价占11.3%,文献需求分析占8%,专题文献分析占5.4%,数据库资源应用占4.8%,科研绩效评价占4.3%,发展趋势分析占3%。从论文研究层面看,理论研究论文量占论文总量的17.3%,应用研究论文量占到82.7%,是理论研究论文的3.8倍,其中又以对某种期刊和某类期刊的引文分析研究最多,约占到论文总量的60%。理论研究论文的减少,反映了对引文分析理论与方法的较深入研究还不够。引文分析应用研究呈上升趋势,反映出了一些新的研究热点,如:期刊影响因子等引文指标在期刊评价中的运用、对期刊引文的聚散性分析、各类期刊学术影响力的比较和评价、学科间科研实力评估、对专题研究的引文分析以及各种网络数据库资源的开发利用等。统计显示,近年来我国引文分析研究中应用研究论文占到了总量的82.1%,载文期刊的81.47%是非图书情报类期刊,呈现出研究热点和应用领域多元化的趋势。在分析方法方面,有些作者也尝试应用聚类分析法、矩阵模型和网络计量学等方法,以及引入概率论、数理统计学、多元回归、模糊数学等高等数学方法,使引文分析研究的方法出现更加多样化的趋势。

四、网络计量学正在加速发展

网络计量学是应用文献计量学和信息计量学的研究方法,对互联网上信息资源的构建和应用、互联网的结构和相关技术进行定量研究的一个领域。从网络计量学的研究对象、方法、内容和目标等方面来看,网络计量学是采用数学、统计学等各种定量方法,对网上信息的组织、存贮、分布、传递、相互引证和开发利用等方面进行定量描述和统计分析,以便揭示其数量特征和内在规律的一门新兴分支学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉边缘学科;其根本目的是,主要通过网上信息的计量研究,为网上信息的有序化组织和合理分布、为网络信息资源的优化配置和有效利用、为网络管理的规范化和科学化提供必要的定量依据,从而改善网络的组织管理和信息管理,提高其管理水平,促进其经济效益和社会效益的充分发挥。

对网络建设和网络利用的定量研究,可具体分为:网页内容分析、网络链接结构分析、网络利用情况分析(通过分析服务器日志考察网络用户的检索和浏览行为)和网络技术分析(包括搜索引擎的检索效果分析及技术研究)等方面。网络计量学具有明显的跨学科特性。这个领域的学者分散在情报科学、计算机科学以及社会科学研究中。社会科学研究中的理论已经应用到网络计量研究中来,比如在对网站影响力的学术网络链接分析中,有学者运用社会网络分析的相关理论来考察学术网络,并提出了“网络社会”这样的术语。网络计量学虽然诞生于1997年,并得到了一定程度的发展,但是目前还说不上已经构建了学科体系。

要保证定量研究的可靠性,就必须获得可靠的数据。但获得可靠的数据需要网络搜索技术的改进和管理权限和制度上的可行措施。虽然网络计量研究更多地关注定量分析,但是随着研究的深入,越来越多的网络计量研究将会辅加一些质化(Qualitative)的研究方法,比如网络用户的行为研究,还有网络链接的动机研究。过去所进行的大多数研究均是认为链接等同于传统文献计量学领域的引文,但毕竟网络链接是一个新兴事物,对其形成动机有必要进行探索,这样才能够在对获取的数据进行分析时有章可循,否则我们只会进行盲目的分析,不能正确解释互联网的相关现象。由于网络动态变化以及用户规模呈指数式扩大,更多的网络用途将被开发,网络在日常生活中的重要性得到提升,网络社区的概念更加普及,如何开发出用于定量研究的新型工具,以及如何让这些工具为更多跨学科的研究人员所利用,则是对这个领域研究者的一个挑战。

从目前的网络计量学文献看,综述性、述评性文献的比例较大,体现了网络计量研究领域的发展尚不成熟,学科体系尚未形成。研究者更多地关注某些子领域,比如最近讨论较多的是网络链接分析、网络影响因子研究等内容,深入的研究成果不多见。

五、文献计量指标在社会科学学术成果评价系统中的作用日趋重要

20世纪70年代以后,国外开始重视在学术评价中增加计量指标。目前最具权威的计量指标多来自美国科学情报所的引文数据库(SCI、SSCI等)。匈牙利学者I.M.贝克(Beck)曾在1984年《科学学》(Science of Science)第4卷上发表了论文“测量科学成果质量的一种新方法”,以科学认识论的结构为依据,创造了一种测量创新成果的42个等级的度量方法——贝克的测量标尺。用这种度量法测试之后证明:最具精确度的物理学和最不具精确度的社会科学都具有相同的认识论结构,也就是说,它们都可以从两个维度测量:理论的深度与成果的成熟度。这种测量方法为社会科学评价体系借鉴科技评价体系提供了理论依据。针对片面强调在SCI上发表成果数量的弊端,2005年又出现了一种评价基础研究成果的新方法:赫希的h指数法(h-index)。h代表“高引用次数”(high citations)。一个人的h指数是指他最多有h篇论文分别被引用了最多h次。这种指数比较适合于多年从事科研工作的资深科学家的总体成就。一个人的h指数不会随着时间的推移而减少,只能增加或停滞不变,并且这种指数很难通过自引而人为地拔高。上述方法对我国人文社会科学成果的评价工作有积极的借鉴意义,但国内目前还没有见到与之有关的重要理论成果。

我国人文社会科学成果的评价研究,经过了定性评价、定量评价和定性与定量相结合的综合评价这三个阶段。这三种形态的评价方式目前依然在不同场合使用着:1.“定性评价”一般指同行评议的方法,这种定性评价方法后来发展成由专家使用某种评价指标体系来进行量化统计的专家评审,它的特点是把同行专家的主观评价按照统一的可统计的评价标准规范化。中国社会科学院研制的“社会科学成果评价指标体系”便属于这种类型。而科学成果评价中的“代表作制”则完全属于同行专家的定性评价。这种方法有时受到同行专家条件的限制,有一定的局限性。2.“定量评价”一般指科学计量和文献计量的评议方法,是根据成果的数量指标和质量指标(引证频次)统计分析后形成的综合指标体系,用以衡量科研成果。现在越来越多的科研机构和管理部门看重它的科学性和客观性,将科学计量学和文献计量学的这种定量评价方法引入科研绩效评价当中。在实践中,由于评价系统不完善或指标使用不当等原因,这种方法也受到诸多的批评,常有对量化的非议文章见诸报端。3.“综合评价”一般是指定性与定量有机结合的全方位评价方法。这种方法意在弥补上述两种评价方法的不足,是眼下比较推崇的方法。

2006年文献计量学在社会科学领域的发展仍偏重于应用领域,文献计量学的定律和公式研究成果不多。中国社会科学院的文献计量学科建设还处于基本建设阶段,近期以完成引文数据库建设为主要目标,同时针对我国人文社会科学发展的需要,开展应用研究;重点分析我国现阶段学科发展的趋势与特点,为宏观决策与研究提供依据;加强学术评价体系的建设,建好定性与定量相结合的评价模式。

标签:;  ;  ;  ;  ;  ;  

2006年社会科学文献计量学发展回顾_文献计量学论文
下载Doc文档

猜你喜欢