普通词汇知识网络中的认知结构:理论、方法与实证_聚类论文

共词知识网络中的认知结构:理论、方法与实证,本文主要内容关键词为:实证论文,认知论文,理论论文,结构论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

doi:10.3772/j.issn.1000-0135.2013.09.010

0 引言

共词网络是利用科学论文中关键词的共现关系构建的一种科学知识网络[1]。对共词网络的研究主要有两个方面:一是卡龙[2,3](Callon M)等1983年提出并于1986年完善的共词分析方法(Co-word analysis)。该方法的理论基础是拉图尔(Latour B)的行动者网络理论[4](Actor Network Theory),研究重点在关键词形成的聚类与层次结构,并在考虑时间因素的情况下分析聚类的演化过程,从而达到对某领域发展情况的认识与总结;二是随着网络研究的兴起,许多研究者试图从网络的角度对关键词构成的共词网络进行分析。其理论基础与方法主要来源于社会网络分析和复杂网络。该范式的主要研究内容侧重考察单个节点在网络中的位置,如节点的中心度与中介中心度[5,6],以及网络的整体特征[7],如网络中的度分布、密度、区块识别与连接机制[8]等,从而达到对由关键词表征的科学知识发展变迁过程进行宏观把握。上述两种路径构成了共词网络研究的主流。

在卡龙的研究范式中,词被分配至相应的聚类,使其处于具体的语境中从而确定其意义,并通过战略坐标对聚类进行分层。但是这种方法对聚类间的关系以及聚类间知识上的联系较少顾及。网络视角下的相关研究又只关注单个词,对词所处的语境没有考虑,从而不容易分析知识间的逻辑联系。那么,如何在既考虑词所处的语境,又考虑其知识上的逻辑联系与变迁过程,就成为共词网络研究中一个值得关注的问题。具体地讲,就是哪些词在网络中起到沟通各研究主题知识上的联系?如何利用这种联系构建相应共词网络的认知结构?这种结构能对我们认识科学知识的产生与演化提供怎样的情报?本文试图通过认知地图、知识计量学等相关理论与概念,对上述问题进行研究与探讨,并通过案例进行实证分析。

1 认知地图

认知地图(Cognitive maps)就是知识在认知状态中的内在结构,这种结构形成人的知识框架和思维格局[9]。认知地图既是一种情报组织方法,也是一种知识表示方法[1]。该概念最早由英国情报学家布鲁克斯[10](Brookes BC)提出。在其发表的系列文献中,布鲁克斯[10]把认知地图看做是“对认识空间、对波普尔[11,12]的客观知识世界(世界3)之结构预先调查”,并认为“如果我们发现了最好的方法,就有可能将选定的紧密相连的若干学科领域的固有联系表示成概念联结网络。每个这样的网络都是表示科学认知结构的一张地图。而每一片段情报都是位于这一网络的经脉之上。这种结构将成为推动科学发展的主观认知结构的副本或近似副本的东西。但这些地图是直观可见的,即它也就是世界3最初的客观化。”

认知地图通过关系索引把文献网变成由知识单元直接联结的概念网,使知识体系从外部宏观结构变成内部微观结构。在认知地图上,每个知识单元就像一个结点或地址,处于创造它们的逻辑位置上,通过相应的关系与其他结点联结,形成一个有机整体。人们可以从“地图”上看到知识系统的动态结构,直观地观察到知识单元在系统中如何活化为情报。同时,人们还可以看到研究者们怎样在密切的学科领域中相互影响、接受情报、构成知识、创造新情报的动态过程[9]。

本质上,“认识地图”就是通过分析文献中的逻辑内容,按知识的逻辑结构找出人们思维的相互影响的连接点,像地图一样把它们直观标示出来,展现知识的有机结构,是对人类知识的分析与组织。

2 知识计量学及其基本概念

2.1 知识计量学

知识计量学(Knowmetrics)的概念最早是刘则渊教授在1998年北京举办的“科研评价暨科学计量学与情报计量学国际研讨会”上提出的一个新学科设想。当时,在《赵红州与中国科学计量学》的发言中,刘教授讲到我国已故著名科学计量学家赵红洲曾谈及科学计量学和经济计量学两门姊妹学科的关系,二者结合对于知识经济时代开展知识经济学研究具有特殊意义,指出:“看来很有必要将科学计量学拓展为‘知识计量学’,并与经济计量学结合起来,对知识生产和应用,知识投入和产出,知识存量和流量,知识分配与转移,知识价值和价格等,进行广泛的跨学科的计量研究。”[13]

随后,刘则渊[14]教授对知识计量学的涵义和应用做了进一步的探讨,并定义“知识计量学”是以整个人类知识体系为对象,运用定量分析和计算技术对社会的知识能力(生产、流通、消费、累积和增殖等)和知识的社会关系(组织形式、协作网络、社会建制等)进行综合研究的一门交叉学科,是正在形成的知识科学中的一门方法性的分支学科。

2009年,刘则渊教授又以知识计量学研究计划和共同开展研究的初步成果为基础,特别是结合对知识可视化探索的成功实践,对知识计量学的概念进行了重新界定:知识计量学是以知识领域为研究对象,以知识单元为分析基础,用数学和电子计算机的手段与方法,从整体上对人类知识活动进行定量和可视分析的一门新兴学科。知识计量学以现有科学计量学、信息计量学、文献计量学和技术计量学等学科为基础,而不是取代这些学科;它力图克服学科术语“巴比仑混乱”,寻求知识单元分析上的共识。

2.2 知识计量学中的基本概念

(1)知识单元

对知识单元的定义目前国内学界并没有统一的认识。赵红洲[15]指出,知识单元是暂时不能量化的科学概念,是科学知识中的最小单位。文庭孝[16]认为知识单元是指在知识管理中可以对关联知识进行独立、自由、有效识别、处理与组织的基本单元,并可以用科学文献中的主题词或关键词加以表达。刘则渊[17]教授则指出所谓知识单元(knowledge unit)是人类知识领域一般用以表征其特定内容的概念及陈述、语词及词组、术语及定律等可计量的基本单位。它是知识计量学的核心概念和基本计量单位。人类知识领域,作为知识计量学的研究对象,其涵盖非常广泛(科学、技术、人文等不同学科门类的知识,著作、文章、专利等不同形态的知识,储存于文献、网络、信息等不同媒介中的知识,以及蕴涵在个人、组织、共同体等活动主体中的知识)。这些知识领域在特定的范围内或特定的场合与条件下,会发生知识单元的分解和会聚、离散和重组、演进和升华、衍生和转化,形成一个从简单到复杂、从低级到高级、从混沌到有序的自组织系统。在一定条件下,某个关键的知识单元可能扮演“知识基因”(knowledge gene)的角色,决定着特定领域知识的进化与突变。这样,基于知识单元的特定知识领域所构成的复杂自组织知识系统,就能够在可视化的知识图谱上展示知识的产生、传播和应用,知识的基础、中介和前沿,知识的结构、演化和重组,知识的涌现、断层和变革,等等。起到知识基因作用的知识单元具有以下4个特征[18]:

①稳定性。主要表现为科学的概念在知识体系中存在时间长、变化小。作为知识基因的概念大都为核心概念,是建立科学的基石。经过时间的考验,这些知识基因为科学共同体所接受或公认,并在相对稳定的认知水平上,由于其稳固性与持久性,成为某一门学科的基本概念框架。知识基因的稳定性、持久性特征是知识遗传的必要保证。

②统摄性。一般地,概念都具有统摄性。知识基因则具有更强的统摄力:除了以稳定的外壳概括了大量的科学事实,统摄范围广阔,还隐含着决定科学概念生成的动力因素。在这一因素影响下,知识基因形成若干分支概念,进而生成相应的具体概念。

③遗传与变异性。知识基因最本质的特征之一——遗传指已掌握的知识基因以文献形式或面授方式被传递给接受者,接受者则继承这些知识基因并在此基础上继续发展,并使其产生变异。变异指知识基因基本内容发生变化。此时原有的知识基因被扬弃或被同化,或与知识变异体(预备知识基因)共存。知识基因的变异体不能脱离原有的知识基因。无论知识内容和形式如何变化,总会看到原有知识基因的影子。知识基因的遗传性反映了知识形态之间的继承关系,变异性反映了知识形态之间的发展关系。

④定向控制知识走向的能力。是知识基因特有的一个本质特征。知识作为一个宏大系统,其中一些基元概念成为学科的奠基石,并作为知识基因决定着这门学科进化的走向。科学史表明,学科的发展离不开其基元概念(知识基因)所决定的框架。这就是知识基因定向控制知识走向的能力。知识基因定向控制知识走向还表现在其渗透力上。有些基元概念如信息、控制等知识基因具有强大的渗透力,它们与其他学科的知识基因相结合,往往导致新学科的创生并开创一个新的知识领域或研究方向。

(2)知识群

知识单元的集合则构成了知识群。

(3)知识链

知识单元之间知识上的联系与演化构成了知识单元的链条,或知识群的链条。形成知识链的关键节点上的知识单元,往往是知识转折点、构成知识群或知识网络的中介桥梁。

(4)知识网络

知识单元之间的联系,形成了知识网络。网络中的节点代表了知识单元,节点间的连线表示了节点间的共现关系,连线的粗细则表征了知识联系的强度。

3 共词知识网络认知结构及其建构方法

3.1 共词知识网络的认知结构

虽然知识单元的定义并无共识,但是学界比较一致的观点则是文献中的关键词可以用来表征知识单元。本文的主旨并不在于寻求知识单元的完整定义,而在于分析关键词所表征的知识单元构成的知识结构。在本文中,我们把科学论文中的关键词视为某种形式的知识单元。由此,关键词形成的共现网络则可视为以知识单元为基础的知识网络,并可以在一定程度上表征布鲁克斯所谓的认知地图。对关键词共现网络结构的分析,就有助于我们直观地观察到知识单元如何活化为情报以及科学家是如何在密切的学科领域中相互影响,接受情报,创造知识与新情报的动态过程。

在关键词共现网络中,一个节点代表一个关键词,节点间的连线及粗细表示关键词间的共现关系与强度。同时,通过一定的聚类规则,网络中的关键词被划分到不同的聚类中,形成了知识群。这些知识群表征了某个研究领域的研究主题,并通过其内部成员与其他知识群产生知识上的联系。知识群间知识上的联系,则构成了共词网络中的知识链。知识链的形式与结构就反映了研究领域各主题间知识上的联系形式与过程,也即其词知识网络中的认知结构。

在网络的视域下,所谓关键词共现网络中的知识群就是整体网络的子网络。陈晓荣[19]等对知识网络连接机制的仿真实验表明,两个网络中具有高中心性或高中介中心性的主体如果建立联系,将有助于网络间知识的流动。这表明两个相互间有联系的网络其知识流动更容易发生在双方的高中心度或高中介中心度的节点间。在卡龙[20]提出的共词分析范式中,网络中节点的连线被分成两个部分:内部连线与外部连线。前者决定了网络中知识群的密度,后者决定了其中心度,并共同决定了知识群在战略坐标中的位置。根据卡龙对知识群中心度的解释,这个指标描述的是知识群与其他知识群知识上的联系,并用其所有外部连线的权重和来计量。该值越高,表明某知识群与其他知识群知识上联系越紧密。斯莫尔[21](Small H)提出可以利用文献间的共被引关系或词之间的共现关系来构建任意研究主题或领域间的知识上的通道,类似于我们在互联网上利用超文本链接进行网页搜索。在确立这样的通道时可以人为附加相应的限制条件,常见的所谓优化通道[22]指用最短路径遍历网络中的各个节点。在一个任意两点都有连接的网络中必然存在这样的一条通道。上述研究成果表明,用知识群中的知识单元与其他知识群的连接强度和来表征知识群间的关系是合理的。

关键词共现网络是一种无向加权网络。知识单元间的连线不但反映了其共现关系,还反映了其共现强度。共现强度越大,两个知识单元间越容易发生知识流动,一个知识单元在网络中与其他知识单元的共现强度总和越大,知识越容易通过它进行流动。知识群中的成员与其他知识群成员的连接强度总和越大,表明该知识群越容易通过它与其他知识群产生知识上的关联。因此,可以构建如下指标来反映知识群间的关系:首先分别计算某个知识群中各成员与其他知识群的连接强度和,其次取其中外部连接强度总和最大值的那个点作为该知识群与其他知识群联系的主要节点。这个连接强度总和我们称之为外部连接度(External linkness),表征了知识群内部成员与外部的知识沟通能力。最大值的知识单元表明了该知识群与外部沟通的主要通道,即该知识群最容易通过这样的点与其他知识群产生联系。同时,它也是决定该知识群在整个网络中所处位置的重要因素。很明显,每个知识群都有一个这样的点。这些点之间的联系,则构成了各知识群知识交流的骨干网络。

各知识群中最高外部连接度的成员在知识群中有两种位置:非聚类起始点与聚类起始点。聚类起始点在知识群内部具有最高的中心度,是相应知识群的“核”。一般情况下,生成知识群的起始词在整个网络中的词频与中心度都不高[23]。这个特点决定了知识群起始词一般不具有最高的外部连接度。反之,知识群中最高外部连接度的词由于与其他知识更容易建立联系,也就是说更容易整合其他知识,从而起着类似知识基因的作用:知识群以它们为基础生成,并主要通过它们与其他知识群产生知识联系。具有这样特征的知识单元一但成为知识群起始词并形成知识群,则往往意味着新领域或前沿的产生。

利用具有上述特征的知识单元间的共现关系,我们可以通过某种规则建立一条遍历各知识群且具有最大知识流动路径的知识链,也即共词网络认知结构的具体形式。知识群通过最高外部连接度的知识单元所形成的共词网络的认知结构,可以分成静态与动态两种形式。在静态结构中,通过赋予知识群以时间参数,从而可以确定知识群间知识的流动方向,就可以看到研究者们怎样在密切的学科领域中相互影响、接受情报、构成知识、创造新情报的过程;在动态结构中,通过考察不同时间段共词知识网络的认知结构,分析其知识连接方式的变动情况,就有可能从知识的遗传与变异角度总结知识的变化与活动模式,从而有助于对知识的利用。

3.2 共词知识网络认知结构的构建方法与过程

(1)数据的收集与去噪

随着计算机技术的普及与发展,结构化的大型科学论文数据库得以建立起来。这些数据库收集了大量的科学论文,并提供包括论文标题、摘要和关键词等结构化信息。利用这些数据库,我们就可以通过检索得到相关学科或领域的某一时期的研究论文,并以结构化的形式通过计算机加以分析利用。在检索得到的论文中,首先要对数据进行去噪处理。对关键词而言,主要是合并同义词。如是英文,则还要根据名词的单复数进行合并。对专业词汇,则需要借助专家的指导。

(2)关键词共现矩阵的提取与处理

一般而言,每篇科学论文中都包含3~5个关键词。这些关键词之间形成了所谓的共现关系。对给定的科学论文集合,我们就可以通过统计任意两个关键词之间的共现次数,从而得到关键词间的共现矩阵。该矩阵为一对称方阵,并规定关键词与自身共现的次数为0。这时得到的矩阵其中的数字表示了任意两个关键词在给定论文集合中共现的绝对次数。其次,统计矩阵中各关键词在给定集合中出现的次数,并利用余弦指数计算任意两个关键词间的共现强度,从而把关键词共现次数矩阵转化为共现关系矩阵。余弦指数的计算公式如下:

其中,F(A)表示关键词A在给定文献集合中出现的次数;F(B)表示关键词B在给定文献集合中出现的次数;F(A,B)表示关键词A、B共同出现的次数。该指数的取值范围在0至1之间,值越大,表明关键词间的共现强度越高。

(3)利用共现关系矩阵生成关键词聚类[20]

①从关键词关系矩阵中找到最大共现值的那对词,作为一个知识群的起始单元。这对词我们可以视其为相应聚类的研究主题。

②找出与这对起始单元中的任一个有共现关系的关键词,并按余弦指数进行降序排列成表。

③从这个表中依次选择关键词放入相应的知识群中,直到其中的成员达到10个为止。这里出于分析方便的考量,人为规定每个知识群最多10个关键词。另外,有些知识群中的关键词也可能会少于10个。

④从矩阵中把这些已进入知识群的关键词删除。然后重复步骤②到步骤④,直到所有关键词都进入相应的知识群中为止。

(4)提取各聚类中外部连接强度和最高的关键词

给定文献集合中任意关键词在共现关系矩阵中的外部连接强度和由下式计算:

(5)共词知识网络认知结构的建立

在斯莫尔[21]的方法中,首先要人为确定一个起点和终点作为路径的首尾两个端点,知识群内部的路径按最小生成树原则确定,外部的路径则以两个知识群间权重最大的那条边作为知识群间的联系通道。与斯莫尔不同的是,本文把路径的起始点规定为具有最高外部连接度的点,路径的范围也限定在所有知识群各自的最高外部连接度的点之间,不涉及知识群内部的路径选择。路径确立的方法则同为最小生成树法则。利用步骤(4)提取出的各聚类中的外部连接度最高的关键词间的共现关系,我们就可以构建连接各聚类的知识链路,也就是共词知识网络中的认识结构。其具体过程如下:

首先确定外部连接度最大的那个点,作为路径的起始点。与其连接强度最大的其他点作为第二个点,从网络中删除起始点,以第二个点作为起始点,再寻找与其连接强度最大值的点作为路径上的第三个点。依次重复这个步骤,直到所有点都进入路径为止。注意,因为不能保证取得的各知识群最高外部连接度的点相互间都有连接,所以路径在生成时有可能中断。如果出现这种情况,则把中断点与其有最高连接值的点相连,然后重复前述步骤。此时的路径将具有带分支的树形结构。

4 案例分析

理论与方法的有效性还需要通过实际检验。在这一部分,本文以2010年获得诺贝尔物理奖的石墨烯发现为例,对此加以验证性分析。石墨烯(Graphene)是一种由碳原子以sp2杂化轨道组成六角型呈蜂巢晶格的平面薄膜,是只有一个碳原子厚度的二维材料。石墨烯在被发现前一直被认为是假设性的结构,无法单独稳定存在。直至2004年,英国曼彻斯特大学的安德鲁·海姆(Andre Geim)与康斯坦丁·诺沃肖洛夫(Konstantin Novoselov)利用一种简单的物理方法——胶带法,制备出石墨烯,从而证实石墨烯这样的二维材料在自然状态下可以稳定存在,并具有新奇的力学和电化学性质。两人也因“在二维石墨烯材料的开创性实验”为由,共同获得2010年诺贝尔物理学奖。

4.1 数据检索

本文选择了Web of Science数据库中的SCI(科学引文索引)作为数据来源,与石墨烯研究相关的文献数据由三部分构成:

首先,用主题词检索方式检索有关石墨烯研究的相关文献。主题检索方式得到的文献在标题、摘要或关键词位置含有相应的检索词,一定程度上表明了文献内容与检索词所涉领域之间的相关性。在本章检索中使用的主题词为“graphene”。其次,还需要检索与科学家所发表的经典文献相关的文献。这些文献同样反映了石墨烯的相关研究。确定这些相关文献,可以使用文献耦合[24,25]的方法。第三部分为引用经典文献的文献。海姆与诺沃肖洛夫二人在2004年后发表的文献中,有五篇在SCI中的被引次数超过1000次,其标题见表1。引用这些文献的文献则可以视为与石墨烯有研究相关。以上述三种方式检索得到的数据可以认为基本覆盖了石墨烯的相关研究。表2为检索结果,图1为数据年度分布情况。

图1表明文献在年度间的分布极不均衡。为了便于统计分析,我们采用如下原则对文献进行分组:①由于石墨烯的发现是在2004年,故以2004年为界,2004年(含2004年)的文献为一组。②2005年后的文献以组内文献数量差异最小且同一年度内的文献不得分割为原则进行分组。分组结果见表3。

图1 石墨烯研究文献年度分布

4.2 石墨烯发现过程的认知结构

使用CitespaceII[26]软件,在前述2004年与2005年的数据集中分段提取出现频次大于或等于20次的关键词。共有86个关键词进入分析。对关键词进行去重合并后,提取这些关键词的共现矩阵并转换为共现关系矩阵,并按3.2节的方法进行聚类,共生成了9个知识群,其内容见表4。

表4中关键词后面的时间表示该词首次达到阈值的时间段。例如,2004表示该词在2004年时间段就已经达到阈值。加黑显示的两个词表示其为该知识群生成的起始词,也代表了相应知识群主要研究对象或内容。表5列出了各知识群外部连接度最高的词及其外部连接度值。加黑的词表示其也是相应知识群的生成起始词。

知识群1主要以碳纳米管为基础进行室温下储氢的研究;知识群2以半金属石墨烯纳米带为研究对象,重点在于纳米带的边缘态,也即边缘处碳原子的拓扑结构。研究内容为电子结构与外加电场间的相互关系;知识群3主要是利用光谱法和隧道扫描显微镜来测定石墨烯微管与碳-60的直径及其电子结构。在这个知识群中出现了2005年时间段的一个词——双层石墨烯,而确定石墨烯的层数最常用的也是光谱法,或是隧道扫描显微镜。知识群4研究内容为碳纳米管的潜在应用,如传感器、场效应晶体管。知识群5则为碳纳米管的制备;知识群6则是利用单壁碳纳米管既作为半导体又作为连接导线,进行薄膜晶体管及相应的电路研究;知识群7为利用富勒烯形成的纳米粒子与纳米线结合构成连接薄膜晶体管各极间的导线,主要研究方向为使用分子动力学仿真技术研究其生成路径与过程以及产物的稳定性;知识群8的主题为石墨烯,主要研究其超导性质。其成员全部是由2005年时间段的关键词构成;知识群9则以拉曼光谱的方法研究碳纤维复合物的光学特征。

表6为各知识群中最高外部连接度词之间的共现关系矩阵。利用这种关系,采用3.2节所述路径生成方法,生成如图2的石墨烯发现的认知结构。在本案中,基于以下理由来确定知识流动的方向:由于新知识只能是在原有的知识基础之上产生,这个过程是单向的,所以可以参考不同知识产生的时间来确定其流动方向。在石墨烯发现前后的知识群中,只有知识群8的成员全部是在2005年新出现的,其余知识群的成员则基本上于2004年就出现了(表4)。这表明知识群8是认知结构中出现的一个全新知识群。图2中的箭头即以此原则加以确定。

图2 石墨烯发现的认知结构

4.3 石墨烯发现后的认知结构及其演化

对石墨烯发现后的演化,本文分2005~2009年、2009~2010年和2010~2011年三个阶段进行分析,以考察其认知结构的变化。各时间段的阈值统一设定为词频大于或等于20次。

2005~2009年时间段进入分析的关键词共有54个,它们共生成6个知识群,内容见表7。每个知识群加黑的两个关键词表示该知识群的生成起始词。从各知识群的内容可以看出这一时期主要的研究对象为“碳”、“石墨烯微管”、“石墨氧化物”与“多层石墨片”。知识群1的研究主题为碳及纳米结构材料;知识群2的主题为石墨烯微管的电子结构;知识群3以石墨氧化物和多层石墨烯片为研究对象;知识群4的研究内容与石墨烯磊晶的制备和光学特征有关,主要为利用光谱学的方法确定生成的石墨烯层数及其光学特征;知识群5为对石墨烯的超导性能的研究;知识群6为利用化学气相沉积的方法利用石墨烯制备晶体管并分析其纳米结构。

2009~2010年时间段进入分析的关键词共有88个,共形成9个知识群,其内容见表8。这一时期的可以分为对石墨烯基础性质的理论研究和对其实际应用方面的研究。基础性研究包括知识群1,研究对象为半金属石墨纳米带的基本理论计算;知识群2则研究石墨和碳纳米管的边缘态以及其电子结构;知识群3以石墨烯氧化物为研究对象,分析其功能;知识群4的主要内容为石墨烯或多层石墨烯的量子霍尔效应;知识群5分析石墨烯的键结构;知识群6为研究石墨烯有光谱特征;应用性研究则包括知识群7,涉及石墨烯与单壁碳纳米管的储氢研究;知识群8和知识群9都与石墨烯在晶体管中的应用有关。

2010~2011年时间段共有137个关键词进入分析,共生成14个知识群,其内容见表9。

知识群1的研究主题为“全能量计算”与“基底函数”,研究内容为对石墨与石墨烯纳米带进行理论分析;知识群2的主题为石墨烯的边缘态,涉及到石墨烯的电子结构、键结构、电导系数以及石墨烯的稳定性研究;知识群3的主题为“还原”和“片状石墨烯”,研究内容为石墨烯复合物的功能化,如氧化石墨烯和多层石墨烯中掺入纳米粒子形成石墨烯复合物从而实现特定的功能;知识群4的研究主题为“兰道能阶”和“量子霍尔效应”。由于石墨烯可以在常温下肉眼看到物理学上的“量子霍尔效应”,使得石墨烯成为研究量子物理学的有用工具;知识群5的研究主题为“多层石墨烯”和“大尺度合成”,研究内容为利用化学气相沉积的方法合成大尺度石墨烯或多层石墨烯,并应用于太阳能电池;知识群的研究主题为“表面”和“隧道扫描显微镜”,涉及对石墨烯及其衍生物进行光谱学分析。知识群7以石墨烯的储氢研究为主要方向;知识群8的研究主题为“碳氢化合物”与“金刚石”,研究内容涉及敏化太阳能电池的应用;知识群9针对石墨烯的较高的电子迁移速率和良好有导电性能,进行场效应晶体管的应用研究;知识群10以石墨烯为主构成的纳米材料用做生物传感器的机理为主要研究方向;知识群11的研究主题为氧化石墨烯的还原;知识群12的主题是“费米能级”和“狄拉克费米子”;知识群13为电子学和纳米电子学;知识群14利用石墨烯生成薄膜聚合物的研究。

按3.2节的方法计算各时间段知识群中知识单元的外部连接度值,取值最高的知识单元,其相关信息见表10。表中各时间段提取的最高外部连接度知识单元按其值降序排列,其中加黑的词为各时间段都出现的词。

4.4 石墨烯发现及其演化特征

由于本文的重点是对第一部分提出的理论与方法进行验证,而不是分析石墨烯研究中的具体问题,所以本文对分析结果仅从宏观方面进行解读。

通过对本文第三部分知识群内容的解读,从图2中可以很容易地辨识出石墨烯发现的知识来源有两条路径:一是碳纳米管的制备与特征;二是碳纳米管的应用。事实上,石墨烯在被发现前,在碳纳米的研究,尤其是在理论计算中起着基本概念的作用,而海姆正是在碳纳米管的研究热潮中选定了石墨作为自己的研究领域。这些事实海姆在获奖致辞时进行了回顾。

关键词石墨烯在其所属知识群中既是知识群生成的起始词,也是该知识群外部连接度最高的词,时间表明其出自于2005时间段。在石墨烯所属的知识群中,其成员都来自2005时间段,表明该知识群的新兴性,并可以视做知识基因“石墨烯”在“碳纳米管”构成的知识链条上得到了显性表达,基因链条上发生了“突变”。

从认知结构的变化可以看到石墨烯的研究具有以下几方面的特点:

(1)认知结构形成的知识链条呈延展伸长趋势。表现为认知结构上的节点随时间增多。在本案中,石墨烯发现后其知识链上的节点数由6个增加到14个。表明对石墨烯的研究在不断深入。

(2)从各时间段的认知结构变动可以看到石墨烯的研究正在从性质的研究向相关化合物与应用方面转移。

(3)石墨烯的研究正在形成一个相对固定的研究领域。首先是随着时间的推移,作为石墨烯重要知识来源的碳纳米管逐渐在链条上消失;其次,关键词“石墨烯”与“石墨”在链条上的外部连接度值呈逐渐增加趋势,其变动情况见图3。

从知识基因的遗传与变异视角审视石墨烯发现过程的认知结构,可以看到石墨烯的发现表现为在碳纳米管基因链条上的突变、表现为石墨烯在链条上既作为知识群的生成起始词,又是相应知识群中具有最高外部连接度的知识单元。当然,在整个链条上产生“突变”的还有其他节点,如“growth/生长”和“composites2004/复合物”,但是这些词在生成时间上不具有新兴性。在知识基因链条上可以同时出现若干处突变,但不是所有的突变都能得到保持,与生物学上对突变的理解是一样的。一旦发生“突变”的知识基因在随后的时间里得到保持并体现为外部连接度值逐步提高,则该基因将导致“新物种”,也就是新的研究领域或学科的产生。在石墨烯研究过程中,“突变”产生后的演化表现为关键词“石墨烯”与“石墨”逐渐在基因链条上取代“碳纳米”占据了主要位置(体现为很高的外部连接度值)。另一方面,在石墨烯研究自成领域之后,其知识基因链条也是不断变化的。这种变化反映了对石墨烯研究的兴趣转移过程。

5 讨论与总结

案例分析表明,本文第一部分所提出的理论与方法在实际应用中是切实可行的,并具有以下功能:

(1)预测新领域的功能。新领域的产生往往反映为认知结构上知识基因的突变。虽然案例分析表明“突变”可能会同时发生在多个基因,但是这个特征至少可以缩小预测的范围。通过考察给定共词网络的认知结构,关注那些产生“突变”的知识基因,就能帮助科学家对可能的新兴领域与前沿快速识别。

(2)从宏观与微观两个方面把握某领域或学科的发展变化模式。分析认知结构随时间变动的过程,总结其特征,就可以从宏观把握其变化模式。在相关领域专家的帮助下,则可以做到从微观层面分析其变化的具体内容与模式。

图3 关键词石墨烯的外部连接度值变动曲线

另外,结合共词分析中的战略坐标,本文的方法也在作者的博士论文[27,28]和相关研究[29,30]中得到了应用,涉及技术的演化与科学发现模式的识别。这也从另一方面体现了理论与方法的适用性。

任何理论与方法都有一个逐渐完善的过程。在本文的理论与方法中,值得改进的地方还有很多。如对知识单元和知识基因的具体定义与功能从理论上讲研究还不充分,表现为知识单元的定义还很模糊,而知识基因更是一个通过隐喻得到的概念。虽然知识基因的变化可以用遗传与变异来描述,但它们毕竟不是生物学意义的基因。那么,知识基因特有的变化规则就是一个值得研究的问题。方法上,本文选择的聚类规则也有一定的主观成分在里面。如人为规定每个聚类最多10个词。这些主观成分也需要通过对聚类规则的研究而应逐步去除,从而使分析结果更具客观性。另外,对知识群的新兴程度的测量也是一个值得研究的问题。

收稿日期:2012年12月18日

标签:;  ;  ;  ;  ;  ;  ;  ;  

普通词汇知识网络中的认知结构:理论、方法与实证_聚类论文
下载Doc文档

猜你喜欢