基于ACA方法的中国当代情报学研究领域的识别与变化研究_情报学论文

基于ACA方法的我国当代情报学研究领域的识别与变迁研究,本文主要内容关键词为:情报学论文,研究领域论文,当代论文,我国论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 引言

随着网络的兴起,新观念、新思想的产生赋予当代情报学新语境,对情报学理论研究产生了深刻的影响,然而,该学科的理论体系相对于其他较为成熟的学科来说并不完善。国内外学者已逐渐意识到该问题并进行了相关研究,产生了丰富的研究成果。国外学者分析了交换理论在情报学中的应用[1]以及构建主义、集体主义、结构主义在情报学中的运用[2],持续探索了经验主义、理性主义、实证主义、实在论、反实在论等一系列情报学哲学假设问题[3,4],研究了近50年来英国情报学研究的主题[5]。国内学者霍忠文、沈固朝提出了从整合 Information和Intelligence的角度研究情报学[6,7]。为了系统地梳理和构建当代情报学的理论体系我们归纳出近20种哲学思潮对情报学的贡献,发表了部分系列研究成果[8,9],旨在探索情报学理论体系中最为核心的哲学基础。

我们在研究中遇到了以下困惑:首先,所建立的情报学哲学基础应该能够涵盖和适用于情报学的所有研究领域,但随着情报学外部环境的变化,情报学的研究领域是否发生了变迁?而又有哪些领域作为情报学的基本领域始终不变?其次,如何修正拟建立的情报学理论体系的信度以及为修正所构建的理论体系而遴选专家的标准是什么?作者同被引分析(Author Co-citation Analysis,ACA)可以从特定学科核心作者的同被引情况入手来识别研究领域及其变迁。正是出于所遇到困惑和ACA方法的特点,我们才采用该方法对我国当代情报学研究领域的识别与变迁进行分析。

2 文献综述

White与Griffth首次将同被引的概念从文献特征扩展到作者特征,提出采用ACA分析科学结构[10]。这项研究以DIALOG平台上的SSCI为数据源,对1972~1979年的39位情报学作者的同被引情况进行分析。随后,情报学界的学者相继采用该方法对情报学学科及有关领域进行不同层面的分析。White等对1972~1995年的12种情报学期刊中前120位的高被引频次作者进行ACA分析[11]。 Zhao等借鉴White等的研究思路对1996~2005年的情报学研究做了ACA分析,研究发现网络对情报学“文献”与“检索”两大阵营的沟通起到了催化剂的作用[12]。Ding等利用ACA分析了1987~1997年信息检索领域的智力结构,发现信息检索理论、信息检索模型、信息检索技术、信息搜寻与检索行为等的研究较为稳定,而在该十年内的前后两部分出现了变迁与融合[13]。就ACA分析操作模式而言, McCain将ACA程序归纳为6个基本步骤,即传统 ACA或Drexel模式[14]。此外,还有大量研究集中在探讨如何从数据源的选择[15]、作者同被引频次计算方法[16]、作者同被引矩阵转换方式[17]、结果可视化展示[18],以弥补Drexel模式的不足。

自20世纪90年代初,国内逐渐注意到该方法并随之开展了研究。王崇德等对国外三种情报学期刊1989~1990年的论文进行ACA分析,将47位高被引作者划分四大学术团体[19]。赵勇等利用SSCI数据库,对1996~2008年24种情报学核心期刊的引文进行ACA分析,发现国际情报学研究热点依然是计量学和信息检索,出现网络计量学等新兴分支学科研究活跃的现象[20]。马费成等分析了37位研究者1994~2005年的同被引情况,将国内情报学研究划分为五个研究领域[21];邱均平等证明了ACA方法在网络环境下的可行性[22];邓三鸿等选择 CSSCI数据库中1999~2007年的引文数据,分析被引频次超过200的前23位作者区域归属[23]。马瑞敏等利用CSSCI数据库中的引文数据,采用大样本作者(大于100)对1998~2007年我国图书情报学知识结构及其演变进行了分析[24]。

以上表明,ACA方法用于分析和揭示情报学研究领域的构成在理论、方法和软件技术等方面都已较为成熟,同时分阶段的ACA分析可以进一步探索情报学研究领域的变迁。已有研究为本研究提供了方法和技术上的支撑。由于国内外数据源的不同,对于国外ACA数据分析软件多以处理SCI与SSCI等英文数据库的数据格式为主;国内已有研究的数据则是以CSSCI中的数据格式为主。遗憾的是, CSSCI未提供1990~1997年的引文数据,也未有利用ACA方法对国内1990~2009年当代情报学研究领域进行识别。因此,本文在已有研究基础上,提出了一套分析国内引文数据的操作流程,采取大样本作者对我国当代情报学研究领域进行识别,并通过采取分阶段分析的策略对情报学研究领域的变迁进行探索。

3 研究设计

如图1所示,本研究围绕“数据获取—数据处理—数据分析”的思路展开,具体分为期刊选取、下载引文数据、引文数据处理和ACA分析四个步骤。为了尽可能反映情报学研究领域的变迁,分别以每5年为一个阶段和20年的标准化的引文数据进行 ACA分析。为了进一步展示核心作者与研究领域之间的关系,借助Ucinet软件,对我国当代情报学主要研究领域之间的联系进行可视化展示。

3.1 数据获取与处理设计

(1)引文数据来源 本文选择《情报学报》、《情报理论与实践》、《情报杂志》、《情报科学》、《情报资料工作》、《图书情报知识》、《图书情报工作》、《现代图书情报技术》与《图书与情报》9种期刊为来源期刊。进而,以CNKI(1990~1997年)和 CSSCI(1998~2010年)为引文数据下载平台,剔除非研究性文章(书评、讲话、会议、活动记录等),获取9种期刊20年的引文数据。

(2)引文数据预处理 当前的ACA数据分析软件多以处理SCI与SSCI等英文数据库的格式(简称WoS格式)为主,无法直接处理中文数据。为此,我们借助CiteSpace软件的数据转换功能和Filejoin合并软件对下载的引文数据分别进行转换和合并处理,最终获得9种期刊20年的标准引文数据。由于 CNKI引文数据没有提供参考文献字段,本研究设计了将期刊原文中的参考文献格式转换成WoS格式的Java程序,并将转换后的每条参考文献添加到相应文献记录新增的CR字段。

3.2 数据分析设计

(1)确定核心作者 23本研究依据被引频次确定核心作者(只计第一作者,同一篇来源文献多次引用同一篇引文文献,只计一次)。ACA对于选择被引频次较高的多少位作者用于分析尚无固定标准。为了便于较好地反映情报学的研究状况和控制可视化图形的展示,在借鉴已有研究的基础上,选择大样本作者,即:在每个时间段均以被引频次处于前120位左右的作者为核心作者。各时段核心作者选取结果如表1所示。

(2)构造标准化作者同被引矩阵 确定核心作者后,借助Bihexcel软件构造情报学核心作者同被引矩阵。进而进行标准化处理。具体方法为:利用 SPSS 18.0软件将作者同被引原始矩阵转换成皮尔逊相关系数矩阵,以消除由作者被引次数差异造成的影响,进一步核查作者间的相似程度。转换成相关系数矩阵后,对角线值最大(全部为1),能够很好反映对角线值的意义。

(3)划分作者核心群体 借助因子分析和聚类分析划分核心作者群体。因子提取选择“主成分法”,旋转方法选择“方差最大法正交旋转”,抽取特征值大于1的指标,并取消绝对值小于0.3的小系数的显示;聚类分析采用“系统聚类”模式,选择“组间连接”聚类方法,度量标准选择“平方Euclidean距离”,输出垂直树状图。进而,借助因子分析和聚类分析结果,利用多维尺度分析判别作者在学术群体中的组成、位置以及子领域在学科中的“地位”。

4 研究结果

由于数据量非常庞大,限于篇幅,这里仅对各时段情报学研究领域的因子分析、聚类分析和多维尺度分析的最终整体性结果和代表性结果进行展示。数据说明主要以1990~2009年的整体分析数据为例,而其余时段只给出最终确定的研究领域。

4.1 因子分析结果

按照研究设计中的分析步骤,五个时段的因子分析结果及其相关指标如表2所示,五个时段所选取的因子数在9~15之间,能够解释总变异量的百分比在86.937%~93.080%浮动,可以代表各时段情报学核心作者数据所反映的绝大部分信息。

以1990~2009年为例,由表2可知,对该时段转换成相关系数矩阵进行标准化后的矩阵进行分析,结果显示相关矩阵中绝对值大于0.3的单元格有9571个,占总单元格数的59.34%,表明大多数作者之间存在相关关系,适合进行因子分析。绝对值在0.5以上的单元格有5999个,占37.19%,这些作者之间的关系为显著相关。依据特征值大于l,该时段共抽取11个因子,通过对各个因子中作者和文献题名的分析,结合本研究的具体情况,最终选取前8个因子,能够解释总变异量的89.009%,足以代表该时段情报学核心作者数据所反映的绝大部分信息。因子命名参照文献主题确定,表3列出8个因子的名称及其载荷因子绝对值大于0.7的作者样例。表中因子的顺序按照能揭示总变异量的大小依次排序。

4.2 聚类分析结果

用SPSS 18.0软件对标准化矩阵进行聚类后,整体的聚类团数和聚类分析距离之间的关系见表4。依各时段因子分析的结果,各时段最终选定的类团数用加粗斜体标识。

1990~2009年的聚类树形图如图2所示。相比之下,因子分析提供的分类比聚类分析更为细致。在因子分析结果中能发现某些核心作者从属于多个因子,而聚类分析则将每一作者归到唯一的类。综合利用因子分析和聚类分析的结果进一步确定多维尺度分析。由图2可知,以1990~2009年的因子数为参考,聚类分析距离取12聚成6类的效果较为理想。

4.3 多维尺度分析结果

利用多维尺度分析,采用二维平面图直接反映聚类中作者之间的距离。综合聚类分析与因子分析结果,1990~2009年情报学的主要研究领域有:知识产权(类1,因子7)、数字图书馆(类2,因子3)和信息检索(类3,因子3)、知识管理(类4-a,因子8)、竞争情报(类4-b、6-b,因子4)、图书馆学(类5-a,因子6)、情报学基础理论(类5-b,因子1)和文献计量(类6-a,因子2),各个领域的位置与结构如图3所示。

由图3可知,20年间,情报学研究领域呈现如下特点:情报学基础理论(包括信息经济)占据近1/3的“版面”,该领域内的作者排列较为紧密,处于情报学研究阵营的中心位置;知识产权相对于阵营主体最为独立;知识管理均为国外研究者,反映了国内知识管理尚未形成影响力大的学术群体;信息检索处于阵营的右上方,与其他领域交叉性较小;图书馆学与数字图书馆规模相当,尤其是图书馆学研究者环绕在情报学基础理论(包括信息经济)周围,充分反映了这些图书馆学研究者与情报学领域存在着关联;数字图书馆也较为独立;竞争情报的位置也与各时段较为一致,处于阵营的左上方,与情报学基础理论(包括信息经济)有着较密切的联系;文献计量处于整个阵营的中心位置,被图书馆学及情报学几大研究主题环绕,体现了科学计量学在情报学领域中的独特地位。

5 分析与讨论

5.1 我国当代情报学研究领域的识别

依据各时段的研究结果可识别出情报学的主要研究领域(按照规模大小依次列出)及其结构特点(位置的方位类似图3):

(1)1990~1994年为文献计量、信息检索、信息经济学和科技情报工作。其中,文献计量处于情报学研究的核心位置,被信息经济学与科技情报工作领域的研究者包围,而信息检索研究者则占据了右侧大半个的位置。

(2)1995~1999年为信息经济学、图书馆学与文献学、信息检索、文献计量、信息资源管理、竞争情报和情报学基础理论。各领域规模较为均衡,图书馆学与文献学、信息资源管理与信息经济学占据了相对居中的位置;竞争情报与信息资源管理及信息经济学联系紧密位于左上方;文献计量左接情报学基础理论,右上毗邻情报检索,分布于右下方。

(3)2000~2004年为信息检索、情报学基础理论、数字图书馆、信息经济学、图书馆学、知识产权、知识管理和竞争情报。情报学基础理论与信息经济学联系紧密占据核心位置,并毗邻竞争情报、信息检索及知识管理;图书馆学与数字图书馆与情报学基础理论研究相对较远,且与其他领域联系较弱;知识产权只是初具规模,位于情报学研究的外沿。

(4)2005~2009年为情报学基础理论、知识组织、知识管理、引文分析、信息检索、数字图书馆及竞争情报。该时段情报学基础理论独占鳌头,处于左下方,且其内部联系较为紧密;知识组织、知识管理、引文分析与信息检索规模相当,占据情报学阵营的另一方;数字图书馆与竞争情报也有一席之地。

各时段情报学研究领域识别的总体状况如表5所示。需要说明的是,由于本研究主要从较为宏观的视角出发,揭示20年的发展状况,数据量非常庞大,因而对领域的命名做了简化处理,如:将网络计量、科学计量、大学评价统称为文献计量。为了便于进一步分析情报学研究领域的变迁路径,对具体领域因子进行了权重赋值。

5.2 我国当代情报学研究领域的变迁路径

图4是按照研究领域的权重和时间维度生成的折线图。通过表5和图4以及各时段的研究结果,我国当代情报学研究领域的变迁路径具有如下特点:

(1)在4个时段中,信息检索一直都是情报学核心领域,呈现从引入到深入,从关注技术到同时关注用户的转换轨迹。1990~1994年,被引频次较多的作者是曾民族、王永成和陈光祚,内容侧重于计算机检索、光盘检索、检索语言、检索理论与检索技术;1995~1999年,被引频次较多的是张琪玉、陈光祚、白国应、赖茂生、苏新宁和彭斐章,内容侧重网络环境下的检索语言、联机检索、分类与主题词表;2000~2004年,被引频次较多的是周宁、黄如花、符绍宏、张琪玉、储荷婷、陈树年、曾民族和焦玉英,主题侧重网络环境下的信息资源组织、网络搜索引擎、网络信息检索和信息检索语言;2005~2009年,被引频次较高的有Spink、Kuhlthau、Belkin、Wilson和 Saraccvic,重点关注以用户为中心的信息检索,如用户信息需求、用户信息行为和用户认知等。

(2)文献计量从1990年开始处于最重要的位置,虽然此后有逐渐减弱的迹象,但从2005年开始又呈上升趋势,关注的重点也发生了转移。1990~1995年,占据了该时期1/3的“天下”,被引的核心作者有汪冰、罗式胜、王国龙、孟连生和邱均平。该时段出版的典型著作有《文献计量学引论》(罗式胜)、《文献计量学教程》(王崇德)和《文献计量学》(邱均平)。1995年后,权重开始降低,反映了兴趣有所减弱,关注的重点是文献计量学基础定律、期刊文献引用规律、核心期刊目录确定等,被引的核心作者有丁学东、罗式胜、张贤澳和俞培果。2000~2004年,由于研究力度减弱,未能居于核心领域。2005~2009年,引文分析脱颖而出,引文索引、引文分析信息可视化、同被引、H指数、网络影响因子等与引文有关的内容成为关注的焦点。被引的核心作者均为国外学者(Garfield、Chen、Rousseau、Thelwall和 White等),反映了该领域成果大都来自国外。

(3)情报学基础理论自1995年初具规模,随后规模逐渐扩大,呈上升趋势。1995~1999年,严怡民和刘植惠是代表性的作者,该时段重在引入国外情报学基础理论,代表性成果有严怡民的《情报学研究导论》和《情报学概论》;2000~2004年,该领域研究阵营的规模达到核心作者人数的1/5,侧重情报学原理和学科建设,被引的核心作者有符福峘、沙勇忠、严怡民、孟广均、梁战平、靳娟娟和王知津;2005~2009年,该领域成为情报学研究的重中之重,研究规模几乎占核心作者数的1/2,关注情报学理论体系和学科发展,被引的核心作者有卢太宏、岳剑波、刘植惠、严怡民、吴慰慈、梁战平和赖茂生。

(4)竞争情报自1995年崭露头角,之后便一直成为核心领域,但规模小于其他核心领域。竞争情报作为我国情报学的特色领域,但研究人数并不多。1995~1999年,重在对竞争情报的发展和研究方法进行理论探索,被引的核心作者有胡安朋、包昌火、陈翔宇和缪其浩;2000~2004年,侧重分析企业竞争情报实践中的问题,被引的核心作者有谢新洲、彭靖里和缪其浩;2005~2009年,关注竞争情报方法、企业竞争情报、竞争情报系统,被引的核心作者有彭靖里、Prescott、陈峰、吴晓伟和王曰芬。

(5)与最为核心的情报学基础理论、信息检索和文献计量相比,知识产权、知识组织和知识管理等与知识相关的主题虽然逐渐兴起但整体上差距仍然较大,呈现不平衡的状态,却是情报学今后的重要研究方向。

(6)对科技情报工作的研究逐渐淡出主要领域。科技情报工作是1990~1995年情报学的研究重点,被引的核心作者有汪廷炯、孙学琛、郭锐、杨沛霆、王槐和钱学森。影响较大的著作有《科技情报工作概论》(孙学琛)、《科技情报科学与技术》(钱学森)。这一方面反映了我国情报学在诞生之初便扎根于科技情报工作,另一方面也映射出该时段情报学基础理论研究的薄弱,自1996年就有学者不断探索情报学基础理论问题。同时由于大情报观的提出,情报学的实践领域已不仅限于科技情报工作。在后三个时段,虽有对科技情报工作的探索,但并未达到主要研究领域的规模。

(7)图书馆与文献学、数字图书馆、信息资源管理、信息经济学呈现出与情报学的融合。这表明情报学与这些领域密切相关,研究对象存在一定程度的交叉和重合。尤其信息经济学是在信息技术不断发展的情境下发展起来的,信息产业、信息市场、信息商品的成本和价值、信息资源开发利用等均为其研究内容,乌家培、查先进和靖继鹏成为被引的核心作者。这再次佐证了情报学具有跨学科性与多学科性的特点[25]。

5.3 我国当代情报学研究领域与核心作者关系的识别

如图5所示,借助Ucinet软件进一步生成展示我国当代情报学研究领域与核心作者的关系图谱,正方形表示因子分析提取的因子,圆圈表示作者,连线表示作者与因子的关联,即该作者在该因子上有载荷系数。

因子1(情报学基础理论)与众多作者有连线,规模最大,代表这些作者在因子1上都有载荷因子,即这些作者能用因子1解释,因子1代表的研究领域能够涵盖这些作者的全部或部分研究主题。同时,因子1与因子2、3、4、6的联系较多,说明这些因子里有部分作者在多个领域里都有被引频次较高的文献,尤其是因子1与因子2、4,体现了情报学基础理论(包含信息经济)与文献计量和竞争情报之间因论文作者而产生了较大的关联。例如,因子1、2之间的汪冰、严怡民、王崇德、庞景安等,他们在文献计量和情报学基础理论领域都有较为重要研究成果,架起了沟通这两个领域的“桥梁”。在其他因子中,只有连接因子3和因子6的作者较多,表明索传军、初景利、董慧等在图书馆学及数字图书馆领域内有较突出贡献,将这两个领域紧密连接。

我国当代情报学研究领域的识别与变迁可为今后研究带来如下启示:首先,信息检索、文献计量、竞争情报、知识产权和知识管理是情报学最重要的研究领域,情报学基础理论应该能够指导这些具体领域。以情报学基础理论中的情报学哲学基础为例,这几个研究领域总体上涉及了情报学的三个基本元概念(信息、情报和知识)。当前对于情报学哲学基础探索的很多成果仍集中在波普尔“三个世界”,但该哲学思潮主要与情报学的元概念——“知识”相对应。因此,我们十分需要寻找与信息和情报相对应的情报学哲学基础,如信息哲学(与信息对应)或军事哲学(与情报对应),以构建能够囊括情报学整体研究范畴的多元哲学基础。此外,在引入新的哲学思潮后,需要借助情报学具体领域的专家对其效度进行验证。该项工作可以通过图5中因子周围的核心作者遴选最终的专家。以军事哲学为例,该哲学与竞争情报紧密关联,在理论上引入该哲学后,可以调研因子4周围的核心作者(沈固朝、包昌火、彭靖里、王知津、谢新洲和吴晓伟等)以验证引入该哲学的可行性。

6 结语

本文从研究中所面临的现实问题出发,采用ACA方法对我国当代情报学研究领域进行识别。同时,通过分时段ACA分析的策略探索了情报学研究领域的变迁。与已有研究不同的是,我们旨在采取一种较为成熟的方法来识别研究领域,以进一步为下一阶段构建当代情报学理论体系做好准备并为后续的专家遴选提供可靠依据。不可否认,ACA方法具有一定的局限性。考虑到我们的研究目的,且限于时间和精力并未在研究方法上进行创新。为了弥补这个缺陷,我们还采用作者参考文献耦合方法进行了类似的分析。我们相信在经过深入研究后,可以进一步提高拟构架的我国当代情报学理论体系的信度和效度。

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于ACA方法的中国当代情报学研究领域的识别与变化研究_情报学论文
下载Doc文档

猜你喜欢