图情领域的大共现及其发展现状,本文主要内容关键词为:发展现状论文,领域论文,大共现论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
在图情领域,共现、耦合、同被引(同引)/共被引(共引)、共词、共篇、合作等分析方法因其在学科结构揭示、领域前沿识别、发展态势判定等方面的独特作用,受到了诸多图书情报研究者的青睐[1-3]。从广泛的意义上来讲,这几种分析方法均与共现现象相关,如两篇文献同时引用一篇文献的耦合分析法,一篇文献同时被两篇或者多篇文献引用的同被引(共被引)分析法,关键词/作者/机构同时出现在两篇文献中的共现和合作(合著)等,杨丽英[4]将这些分析方法统称为“共现大家庭”,现在我们将这种与共现现象相关的各种分析方法的集合称之为“大共现”,即该集合包含各种共现、耦合、同被引(共被引)、合作(合著)、共词、共篇等分析方法。 2007年以前研究者对共现现象的研究类似“盲人摸象”,每位盲人通过摸“象”的具体部位,表达自己对“象”的不同理解和认识。杨立英[4]在其博士论文中从理论上阐述了科技论文的共现原理,对包括耦合、共被引、共篇及合作等在内的一些主要共现分析方法和关键技术进行了梳理、归纳和总结,并针对共现特征项的特点将共现分为同共现和异共现。 时至今日,研究者对共现现象的研究依然属于单打独奏,少有的几篇论文涉及了大共现所包含的较多分析方法,如邱均平、董克[5]利用作者合作、作者共被引、作者文献耦合、作者关键词耦合及作者期刊耦合五种网络分析比较了不同共现网络揭示科学研究结构的能力;邱均平、刘国徽[6]在进行学科知识深度聚合研究过程中系统梳理了各种共现关系并对他们进行了分类,等等,更多的文献只是对几种分析方法的综合使用或者对大共现部分成员(耦合和共被引等)之间的关系进行了阐述,鲜见将这些方法作为一个整体对其方法本身的发展情况及其发展现状进行研究。本文拟从大共现视角出发,从宏观角度全面分析大共现这一分析方法,试图对“大象”的整体形象进行窥探,勾勒大共现分析方法这头“大象”的全貌。 1 大共现及其派系 1.1 大共现 在特定检索条件下形成的文献合集中,经常会有一些特征项(如,文献、关键词、作者等)会在不同文献中同时出现,图书情报领域的研究者可以通过分析这些特征项所形成的集合进而发掘隐藏在这些文献中的其他重要信息,如领域的学科结构、研究方向和研究主题等。大共现就是利用特定领域文献合集中某一个或几个特征项同时出现的现象进行深度情报分析的情报分析方法集合的统称。目前,已有的情报分析方法中符合其定义的分析方法及其派系成员主要有:耦合(作者耦合、期刊耦合、学科耦合、文献关键词耦合、作者期刊耦合、作者关键词耦合、作者文献耦合、作者引文耦合、作者会议耦合)、共被引(共引)/同被引(同引)(文献同被引、作者共被引、学科同被引、期刊同被引、主题共引、词共引、类共引[7])、合作/合著(机构合作、作者合作、国家合作)、共词、共篇、共现(关键词共现、词/词汇/词语共现、标签共现、作者共现、多重共现)6个分析方法及24个对应的派系成员。 1.2 大共现成员及其派系 大共现概念所包含的各种分析方法都依赖于对一些特征项的分析,这些特征项具有自身的特性和优势,对其单独使用或者交叉使用形成了不同的分析方法,如期刊同被引(单独使用了期刊这一特征项)、作者期刊耦合(同时使用了作者和期刊两个特征项)。图1为对特征项不同方式的使用所形成的大共现概念下主要成员及其派系组成结构图。由图1可以看出“作者”特征项在大共现分析中被运用的更为广泛,涉及作者共现,作者耦合、作者合作、作者文献耦合、作者关键词耦合、作者期刊耦合、作者会议耦合、作者同被引8种分析方法,“文献”作为一种分析方法的载体被共篇、论文同被引、引文耦合、文献关键词耦合、作者文献耦合等分析方法所采用。此外,包括“关键词”在内的“词”(将两者分开统计,体现关键词共现在大共现分析方法中的独特地位和作用)也是大共现分析方法的热点字段,分别被关键词共现、作者关键词耦合、文献关键词耦合、词共现、共词等分析方法所采用。 此外,由图1还可以看出,在大共现的阵营中,耦合分析、共现分析和共引分析三种分析方法由于其分析方法的特殊性,其派系成员相对较多,所采用的字段也相对广泛,得到了更多研究者的青睐,枝系发达。而共词、共篇和合作/合著由于其分析方法的局限性,目前其枝系还欠发达。 1.3 大共现成员及其部分派系分析方法的历史发展脉络 为了解大共现分析方法的发展历史,作者梳理了大共现分析方法的主要成员首次被提出的时间及提出国和提出者,如图2所示,使读者了解在大共现分析方法发展历史上做出了主要贡献的关键人物和方法被提出的时间节点,对大共现分析方法有一个全景认识。


由图2可以看出,在大共现的发展历史上,耦合的分析方法最先出现,1963年由美国的Kessler提出,1981年由中国王洵引入国内[8],当时将其翻译为文献合配,1985年罗式胜将其翻译为文献耦合[9],由此耦合的概念正式在国内被采纳和应用。随后在图情领域出现的第二种大共现分析方法是作者合作,于20世纪60年代由美国的Price和Beaver提出[10],1973年美国的Henry Small和Irina Marshakova[11-12]提出了论文同被引概念,20世纪70年代[13]由法国开始的共词方法进入研究者的视野,1981年美国的White和Griffith[14]同时提出了作者同被引,1991年,McCain[15]首次将Small的同被引思想应用于期刊研究,提出了期刊同被引,2002年中国的郑华川等人[16]提出了共篇的分析方法,2008年加拿大的Zhao Dangzhi等人[17]提出了作者文献耦合分析方法,2010年中国的刘志辉等人[18]提出了作者关键词耦合,2014年中国的邱均平等人[19]提出了作者会议耦合的分析方法,进一步丰富了耦合分析方法。 1.4 大共现成员在图情领域的分析作用 大共现所包含的各种分析方法在原理上既有相似性又存在差别,所以在图情领域中所发挥的作用在保持功能相似的同时又具有其独特性。图3为大共现的6大分析方法在图情分析领域中发挥作用示意图。由图3可知,各种分析方法具有其分析功能的独特性:耦合分析可用于揭示学科结构、预测技术突破、判断主题相似性;共现分析方法可以建立领域叙词表、发现经典文献,找到学科领域的研究方向和研究主题,实现词间检索,应用在专利上则可以发现专利的核心技术;利用共引分析方法可以确定核心期刊,进行领域分析,了解学科结构发展概况及进行科研评价,合作/合著分析方法对于科技合作类型、特点及影响因素的揭示,信息传递和知识交流有独到之处。而大共现各种分析方法在功能体现上又有其相似性:信息检索/学科发展趋势两个功能为耦合、共现、共词和共引四种分析方法所共有,即采用这四种方法之一就可以实现一定的信息检索并且可以从某种角度了解学科的发展趋势;利用耦合和共篇的分析方法均可以实现了解科学研究现状的目标,想探寻学科间关系可以采用耦合或共现分析方法,共引和耦合分析方法均便于探测研究前沿,共现、共词和共篇分析方法均可进行研究热点分析,耦合及共词分析方法均可用于揭示学科结构。

2 大共现分析方法的国内发展现状 2.1 数据来源 本文基于CNKI的论文数据分析了共现研究方法在国内的发展现状。本研究的数据来源为CNKI数据检索平台,选择高级检索中的专业检索,检索条件为:(主题=“机构合作”OR“国家合作”OR“合著”OR“共词”OR“共篇”OR“作者合作”OR“共被引”OR“同被引”OR“耦合”OR“共现”OR“共引”OR“同引”)与(期刊名称=“图书馆学研究”OR“图书馆工作与研究”OR“图书馆理论与实践”OR“情报资料工作”OR“情报杂志”OR“现代图书情报技术”OR“情报科学”OR“情报理论与实践”OR“图书情报知识”OR“图书馆杂志”OR“图书馆建设”OR“图书馆”OR“图书馆论坛”OR“图书情报工作”OR“情报学报”OR“大学图书馆学报”OR“中国图书馆学报”OR“国家图书馆学刊”OR“图书与情报”)。以上19种期刊为《中文核心期刊要目总览北大核心2011年版》中G25类:图书馆事业、信息事业所列所有期刊。检索时间为2015年4月14日,检索图书情报领域内所有与大共现分析方法相关的文献共1150篇,去掉简讯、主持人导语、服务宣传等非学术论文,最终得到有效论文1 109篇。 2.2 研究工具和方法 本文以TDA、Excel及社会网络分析软件Ucinet为主要数据分析工具,首先利用TDA的数据清洗功能和数据融合功能对原始数据进行了清洗、整理,采用数学统计方法对大共现领域的整体发展趋势和现状进行了详细分析;随后利用TDA的共现功能获取关键词共现矩阵及作者共现矩阵,采用社会网络分析软件Ucinet对关键词共现矩阵、作者共现矩阵进行可视化,并分析网络结构,计算网络密度、点度中心度、中介中心性等相关指标,分析了大共现分析方法的发展现状。 2.3 国内大共现领域的统计分析 2.3.1 大共现领域的整体概况 国内图情领域大共现分析方法研究起步较早,最早发表的关于大共现的论文出现于1982年,为王洵等人发表在《情报科学》上的《引文分析中的“同引”》。此后该领域的相关论文零星出现,直到2006年该领域发表的论文数量才突破20篇且增长迅速。具体的,大共现领域论文数量变化分为两个阶段(见下页图4),第一阶段:1982~2005年,该时间段内大共现分析方法相关论文发表数量较少,且数量增长缓慢,除1999年、2000年及2005年发表论文数超过10篇以外,其余年份发表的论文数均不足10篇,个别年份的发文量只有1篇。第二个阶段是2006~2014年,为大共现领域论文数量迅速增长阶段,2014年论文数量达到190篇。 2.3.2 大共现领域发文机构分析 对大共现领域发表文章的机构进行第一机构和全机构(前16个单位)分析发现(见下页表1),两种方式的排名中武汉大学的总发文量均居于榜首(分别为139篇和198篇),且发文量远远高于排名第二的中国科学院国家图书馆(分别为96篇和124篇)和第三的南京大学(分别为59篇和74篇)。中国科学技术信息研究所和大连理工大学进入第一单位统计排名前五的位置;中国科学院研究生院和中国科学技术信息研究所进入全单位统计排名前五的位置。

武汉大学所发表的论文多采用与作者字段相关的大共现分析方法,如作者合作、作者共被引、作者同被引、作者关键词共现、作者文献耦合、作者会议耦合等,主要用于探测图书情报、知识管理等领域的研究热点、科学结构揭示等,此外,共词和共引分析方法的相关研究和应用也是武汉大学一个重要的研究方向。中国科学院国家科学图书馆的研究方向则相对集中在共词分析方法的研究和应用,主要用于知识发现、学科主题演化、研究热点分析及领域信息可视化等分析。南京大学所发表的论文多利用合作(著)如国家合著、作者合作(著),及共引如作者共被引相关的大共现分析方法,主要用于领域研究热点、研究热点与演化趋势分析等。 2.3.3 大共现领域发文作者分析 对第一作者和全作者发文量分析(分别取前17位、18位作者)发现(见表2),武汉大学的邱均平不论是在第一作者发文量还是在全作者发文量上都远高于其他作者,数量优势明显。以第一作者统计,邱均平发表文章的数量(57篇)比第二名的赵蓉英(15篇)多42篇,第三名及其后名次作者的发文量都不足10篇;按全作者统计邱均平发表文章数量(64篇)高于第二名的冷伏海和赵蓉英46篇。 以邱均平为作者的论文多涉及与作者字段相关的大共现分析方法的使用,如利用作者会议耦合研究学科领域的知识交流,利用作者共被引分析方法研究馆藏资源的深度聚合模、对知识图谱进行实证研究及借助该分析方法深度挖掘国内知识管理领域发展现状等。以赵蓉英为作者的论文多涉及共引及共词分析方法的利用,如利用共词分析方法探测近10年我国社会科学领域信息服务热点,对馆藏资源进行语义聚合研究;利用共被引分析方法勾勒了图书馆学、跨语言信息检索的知识图谱,挖掘信息服务领域研究热点和前沿等。以冷伏海为作者的论文则多涉及共词分析方法的使用,主要用于非相关文献和未来技术预测及主体识别和演化,如用于K-clique社区知识创新演化方法研究,用于文献隐性关联知识发现研究,用于学科主题演化方法改进研究等。


3 共现网络分析 3.1 关键词共现网络分析 3.1.1 获取高频关键词和构造共词矩阵 通过对1 109篇文献的关键词进行词频统计,共获取1047个关键词。为保证共词分析的效果,将不规范的关键词进行了规范化处理,如将CiteSpaceⅡ、Citespace、Citespace信息可视化、CiteSpace软件等规范成Citespace。按照词频由高到低进行排序,并截取词频不小于10的57个关键词作为高频关键词(如表3),并以此57×57的对称矩阵作为关键词共现分析的基础。


3.1.2 关键词共现网络相关指标计算及可视化 利用Ucinet软件,以57x57的关键词矩阵为基础,计算了关键词共现网络(如图5)的网络密度、点度中心度、中介中心性,并绘制了其共现的可视化图形。 网络密度表征的是一个图中各个点之间联络的紧密程度,本文关键词共现网络的密度为2.8131,表明该网络中各点之间联络的紧密程度较大,整体网络的连通性较好,说明大共现领域各个研究方向之间相互交叉,相互渗透、交融性较大;另一方面也可以表明大共现领域各成员之间确实存在很强的相似性,领域分析的对象、分析方法、分析效果均非常相似。 点度中心度的计算结果表明:共词分析的绝对中心度是299,知识图谱的为205,说明他们与网络中其他关键词至少共现299和205次。本文以57个关键词为数据源,所以说共词分析与其他每个高频关键词的平均联系次数为5次,知识图谱也达到4次,充分说明中心度高的节点——共词分析和知识图谱对整个网络的影响较为明显。中介中心性计算结果表明该网络的中心性为6.77%,不到10%,说明整个网络的中介中心性相对较低,大共现共词网络中共词分析、文献计量学及社会网路分析的中介中心性较为突出,表明他们是其他关键词共现的桥梁。 图5是关键词共现的可视化图形,每个节点表示大共现网络的研究主题词,节点的大小表示关键词中介中心性的大小,节点越大表明关键词的中介中心性越高。由该图可以看出共词分析、社会网络分析方法、文献计量学、知识图谱及可视化等方向为大共现领域热点研究方向。 3.2 作者共现网络分析 通过对1109篇文献的全部作者进行统计,共有1551名作者参与大共现领域的研究。利用TDA对作者姓名进行清洗,按照发文数量由高到低进行排序,截取发文量大于3的162名作者(前18名作者如表2所示),并以此162×162矩阵作为作者共现网络分析的基础。 计算作者共现网络的网络密度为2.1496,小于关键词共现网络密度(2.8131),表明在各自的阈值下,作者共现网络中作者之间联络的紧密程度较共词网络中关键词所代表的研究方向小,但整体作者共现网络的连通性相对较好,说明大共现领域各个研究者之间合作的机会较多;点度中心度计算表明邱均平的绝对中心度是38,肖明为15,说明他们与网络中其他作者至少合作过38次和15次,在大共现领域的作者共现网络中处于中心地位,具有较大的“权利”。中介中心性计算结果表明该网络的中心性为1.71%,只有1/5作者的绝对中介中心性大于零,说明整个网络的中介中心性相对较低(与阈值高相关),网络中的信息交流被少数几个人(如邱均平、武夷山、宋艳辉、高继平)所控制,是其他作者合作的桥梁。 此外,我们根据该作者共现网络图对这些作者团队进行了划分,由图6(节点越大代表作者的中介中心性也越大)可以看出,在共现次数大于3的作者群体中有五个大的作者合作网络。他们分别是:(1)以武夷山为桥梁,邱均平、高继平为中心形成的一个大的作者合作网络,包含28名作者;(2)以崔雷、孙涛涛为中心的作者合作网络,包含11名作者;(3)以刘志辉、张志强为中心的作者合作网络,包含10名作者;(4)以冷伏海、王立学等人为中心的作者合作网络,包含8位作者;(5)以李长岭、支玲等人为中心的作者合作网络,包含6名作者。很明显,在该网络图的最左侧有一些作者与其他作者的合作次数小于3,成为该网络上的孤立点。 4 结语

大共现概念的提出将现有的部分情报学分析方法归纳在一个分析方法统称之下,一方面有利于情报研究者了解情报分析方法的粗线条组成(可以将所有情报分析方法分为两个大类:大共现和非大共现分析方法)和结构,使其理解在层次上更加清晰;另一方面,大共现分析方法所包含的各种分析方法是情报研究中的主要分析方法,其枝系的丰富将会有效的促进情报研究的进一步发展。大共现概念的提出可以将这些具有共性的分析方法及相关特征项展示在一个公共平台上(如图1所示),使情报分析者更易对它们进行区分,联系,更易发现一些大共现维度下未曾被发现的新分析视角和分析方法,进一步丰富情报分析方法。此外,大共现概念的提出希望情报研究者能将部分研究视线转移到大共现分析方法本身上来,而非一直紧紧围绕已有的、成熟的情报分析方法在各个领域的应用,当然后者也非常重要和必要。 利用大共现概念,通过对其宏观的全角度分析发现:大共现分析方法在国际上虽然起步较早,但是2006年以后才在中国真正发展起来。目前已经发展出6个主要成员(耦合、共现、共词、共篇、合作、共引)及其24个派系成员,发展势头迅猛;其所分析的对象由最初的文献扩展到关键词、期刊、会议等,分析方法所实现的功能也日渐细化和丰富;武汉大学、中国科学院国家科学图书馆及南京大学是该领域的主要研究单位,邱均平、冷伏海、赵蓉英及崔雷等人是该领域的主要研究者;共词分析、文献计量学、社会网络分析及知识图谱等研究方向是大共现领域的研究热点,其所形成的关键词共现网络的连通性较好,共词分析对整个网络的影响较大且是其他关键词共现的桥梁;作者共现网络中邱均平和肖明处于网络的中心地位,且网络中的信息流动被邱均平、武夷山等少数几个人控制。 诚然,本次工作只是对大共现分析方法的一些简单梳理,运用社会网络分析方法也只是得到了一些该领域的研究热点,对于大共现领域的研究主题及研究方向没有涉及,对于大共现领域全貌的揭示还比较浅显,有待于采取其他有效的分析方法和方式对其进行更为深刻的理解和描绘。
标签:相关性分析论文; 文献分析法论文;