知识网络、知识链接与知识服务研究_元数据论文

知识网络、知识链接和知识服务研究,本文主要内容关键词为:知识论文,链接论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

20世纪90年代末期开始,电子出版业和信息服务业领域出现了很多新的现象,期刊价格上涨导致信息机构期刊采购量下降,新型的科研成果出版模式如电子印刷(e-print)、机构知识库等大量出现,与知识链接直接相关的新的技术标准如DOI/CrossRef、OpenURL/SFX的大量出现[1]、用户日益增长的对知识全面链接的期待变得迫切等等,意味着这两个行业正在产生巨大的变革。依靠互联网有效的知识链接技术以及相关的标准和规范来解决信息的传播和服务所面临的问题,成为这两个行业无法回避的挑战,同时也是这两个行业所面临的新的发展机遇,抓住了它可能前程无量,而错过了它可能后患无穷。在这样的环境下,知识网络、知识链接和知识服务开始成为这两个行业所关注的焦点。本文将探讨知识网络的概念、类型和特点,知识链接与知识网络之间的相互关系,基于知识链接的知识服务的几种不同的模式。

1 知识网络和知识链接的概念及相互关系

客观事物是彼此关联的,知识作为客观事物属性和发展规律的真实反映,必然体现出客观事物的这种关联,而这种关联的表现形式之一就是知识网络。美国国家科学基金会1999年给知识网络下的定义是:知识网络是一个社会网络,提供知识、信息的利用。我国学者赵蓉英认为:知识网络是由众多的知识节点(知识因子)与知识关联构成的集合[2]。这两个概念前者突出了知识网络的社会属性,后者突出了知识网络的构成特点。

知识网络是由知识体以及它们之间的彼此关联关系所形成的网状结构的知识集合。其中,知识体可以是知识元素、知识因子、微观的知识集合,可以表现为词、句子、段落、文章等知识的构成要素和表现形式;知识关联有知识内容之间的本质的内在属性的关联和知识附加属性之间的关联两种形式。知识内容之间的内在属性关联是知识所描述的事物之间相互的内在的联系性决定的,这种内在的联系一般表现为知识体之间具有的同一关系、从属关系和相关关系的联系[3],比如两个知识体描述的是同一主题的事物;知识的附加属性是由于知识表达、展现、识别和版权归属等需要,决定了知识发布时一定会伴随着一些附加数据而出现,比如一本图书除了有图书的知识内容之外,还有书名、图书的创作者、出版商、年代、类型(生活类、小说类、励志类等)、ISBN号、载体形式等附加内容;期刊论文有创作者、刊物名称、论文名称、出版商、作者所属机构、载体形式、发表时间、类型等附加属性。任何一种知识的属性,不论是内在的还是附加的属性,都有可能作为一种关联属性构成知识网络或者知识网络的子网络。一般而言,附加属性知识网络中知识关系明确简单,可以完全由信息服务方来创建这种网络;而内在属性知识网络中知识关系复杂多样,动态性较强,某些知识关系只能由知识生产方动态地建立,比如一个新的知识发现,某些知识关系只能由领域专家才能建立,比如概念本体。信息服务方目前主要是通过表达知识的概念关系来建立知识网络,比如主题概念、本体、概念的学科属性(分类)、主题图等。这种关系可用图1表示。

图1 知识体、知识链接和知识网络之间的关系

知识网络涉及两个以上的作为节点的知识体、知识体之间的关联关系以及将知识体联系在一起的技术和方法。因此,可以把知识网络研究的主要问题归纳为三个方面,即关于知识体的研究,包括知识的构成、知识的表达、知识的记录、知识的形式、知识的计量、知识的传播等;关于知识关联的研究,包括知识之间存在何种关系、如何表现这种关系等;关于知识链接的研究,包括如何提取知识,如何从一个知识点跳转到另一个知识点、如何获得相关知识的集合,如何展现知识集合等技术和方法。知识链接要在知识体和知识关联研究的基础之上,通过工程化的技术和方法来具体完成知识体之间的连接,其结果就形成了实在的知识网络。

知识链接可以定义为根据知识体之间的关联关系将它们联系起来的过程、方法和技术。广义的知识链接可以指知识体之间点到点,点到面以及面到面的关联;而狭义的知识链接主要是指知识体之间严格的点对点的关联关系连接知识点和微观的知识集合。

2 知识网络的类型和特点

由于知识的存在形式和表现形式是多种多样的,知识网络也是多种多样的。笔者进行了不完全地归纳,将知识网络的类型总结为图2。

2.1 人际知识网络和知识体知识网络

从知识的存在形式看,可以分为两种情况考察:

第一种知识网络:人与人之间的知识网络,称之为人际知识网络。

这种知识网络中,知识存在于人脑中,需要直接从人脑中激发出来;知识体之间的关联关系是相对模糊的,可能由个人的兴趣爱好、工作性质、研究领域来决定知识的联系;网络的边界也是不确定的;知识体联系在一起的技术和方法有非正式交流过程、人际关系网、网络社区、企业知识地图、具有Web2.0特征的WiKi等。

人际知识网络的特点表现为:(1)可以是临时性,也可以是相对长久的。临时的如学术会议期间所构成的知识交流环境,相对长久的如人际关系网和网络社区;(2)链接随意性强。人与人之间的知识如何交流、如何碰撞出新知识火花都比较随意,链接知识的技术往往只是提供了一种可能产生链接的环境;(3)链接的结果可控性差。是否能够链接或者哪些知识实现了链接由人的主观决定,链接结果往往不可控;(4)链接的效果佳。由于人脑中的知识虽然总量不够,但都是活化的知识,加之交流环境的激励因素,这种知识更容易为人所领悟和掌握,人与人之间的知识交流和知识网络往往更具有活力,能够达到最佳的交流效果,知识链接的效果也最好。

第二种知识网络:知识体和知识体之间的知识网络,称之为知识体知识网络。

这种知识网络中,知识存在于物质载体中,需要从物质载体中提取出来;知识体是以语言的形式记载在载体上,载体把知识体集成在一起;知识体之间的关系需要根据知识的内在特征和外在特征进行智能化梳理、对知识加以重新整合才能体现出来;将知识体联系在一起的技术和方法有传统的目录法、索引法、引用法以及现代的超文本链接、主题网关、参考链接等。

知识体知识网络的特点有:(1)网络中知识的颗粒度不同。由于知识用语言来表达,可表现为字、词、句、段落和文章,呈离散的状态,需要链接的知识是词、段落还是文章本身的颗粒度不同;(2)载体虽然集合了知识,但也割裂了知识,需要突破载体的限制。比如一篇完整的文章包含了多个知识点和多个知识集合,如果需要与另一篇文章中的相似的知识点和知识集合加以联系,必须打破文章本身的限制,深入到文章内容本身;(3)载体中知识的内容构成和知识的附加属性都可以作为知识链接的节点。比如知识的内容所反映的主题和所属的学科门类,知识的附加属性如责任者、机构、项目、日期、发表刊物等。

图2 知识网络类型图

上述两种形式的知识网络,人际知识网络在知识管理领域有较多的研究,企业知识地图的研究就是典型的例子,企业家们迫切需要把处于破碎点状态的保存在个人头脑中的知识通过知识网络联系起来,解决企业的知识的确存在、知识可以分享、知识可以定位、知识可以利用的问题,以推进知识创新,应对快速变化的市场。此外,对于互联网时代的社区知识网络也有比较多的研究,该研究主要是针对基于互联网的新型的社会网络形式展开,阐述这种社会网络作为网络的特性,重点不是其中的知识链接。知识体知识网络在知识组织和知识服务领域有较多的研究,知识的组织者和服务者需要将知识的多种属性揭示出来,并期望通过某些技术将它们提取或者完整地展现给需要这些知识的人们,以实现信息资源的开发、促进知识的创新。这些研究中最核心的内容主要有两个,一个是借助引文链接或称参考链接技术和方法生成知识网络,典型的代表是Web of Science。由于引文链接状态在某种程度上可以反映文献的质量,引文分析工具常常用来作为评价科研成果质量的依据,由此带动了引文链接技术和方法的普及和传播;另一个是基于互联网技术生成知识网络,典型的代表是超文本链接。借用的OpenURL和SFX软件的创始人Vande Sompe的话“用户梦想的是一个覆盖全部学术信息资源的信息系统,所有信息互通互联,信息获取简单准确”[1,4],这样一个信息系统依赖互联网技术才能有效实现。

上述两种形式的知识网络都因为信息与通讯技术的发展而得到了前所未有的发展。因为互联网技术的推进,人与人之间的知识网络可以无限增加节点的数量,Web2.0技术使人际知识网络的运营成本极大降低,其根本性地改变了知识网络的性质。可以说20世纪90年代之前的人际知识网络的主要特征是专家网络和权威网络,而现在的人际知识网络是多种成分构成的网络,草根人际知识网络或者群众智慧所构成的知识网络成为Web2.0时代知识网络的新品种,它所吸引的能量、所产生的应用效果是前所未有的,典型的例子是维基百科,虽然不一定由权威或专家来撰写每一个词条,但是依靠群众的智慧和大家的贡献,可以将一个词条优化到专家级水平。因为信息与通讯技术的推进,知识体知识网络同样发生了巨变,今天的知识网络已经可以跨越载体结构的局限,跨越数据库、出版商、图书馆之间的界限,深入到知识单元,实现知识点对点、点对面之间的关联,典型的例子是OpenURL和SFX,SFX可以分析用户通过机构的数字图书馆访问的所有资源,OpenURL可以看做是资源开放链接的实现工具,可以将用户指向它所能够获取的每个信息对象的最合适的链接,所链接的对象是遵循开放链接标准的所有的网络对象,包括文摘索引数据库、电子期刊、OPAC系统、电子出版物系统等,而不管这些对象是否属于同一个数据库、是否属于同一个出版商、是否属于同一个图书馆。

2.2 其他各种类型的知识网络

除了上述两种知识网络外,还可以根据知识网络的其他特性划分不同类型的知识网络。

根据知识表达和发布的形态不同,可以把物质载体形态构成的知识网络分为两类,一类是按出版发行机制从产生的各种纸质载体形式的文献,包括图书、期刊论文、会议文献、政府报告等中构建的知识网络,一类是借助互联网技术从直接发布的信息,如各个机构的网站、个人网页、BBS等中构建的知识网络,纸质载体的文献经过数字化或者直接通过数字出版,也可能转换成为互联网中的信息。互联网本身是一个通过信息技术连接了各种信息的网络,其中包含有大量的有用知识,由于这些知识之间缺乏有机的联系,关系不明确,所以它还不能算作严格的知识网络,只能算作信息网络。目前人们正在尝试将互联网上的信息变成有序化的、易于获取的网状结构知识,并且利用各种基于互联网的创新技术,通过知识链接构建各种知识网络,这种知识网络代表未来知识网络的主流和发展方向。

从知识网络中知识之间的关系看,知识网络有:学科知识网络,即根据知识的学科属性来链接知识体,将属于同一学科的知识内容聚合在一起,常常使用分类的方式实现;主题知识网络,即按照主题来聚合知识,将论述同一事物的知识聚合在一起,常常采用主题法的方式实现;引文知识网络,即按照科学文献后附的参考文献,将具有相互引用关系的文献知识聚合在一起,常常采用引文索引的方式实现;人物知识网络,即将有共同兴趣、共同研究领域的人聚合在一起,形成他们的思想、感受、体会等方面的知识网络,常常用专家网络、知识社区、网络论坛、邮件列表等形式来实现。

从知识网络的链接形式看,知识网络有:目录+原文的知识网络:是纸质媒体知识网络的主要构成形式;索引+原文的知识网络:从文献索引、关键词索引或著者索引等类型中获得原文并形成知识网络;引文+原文的知识网络:包括从引文到被引论文以及从被引论文到后续引文的知识网络;知识属性+原文的知识网络:主要是从知识的某一个属性出发形成的知识网络,如机构+原文的知识网络。

从知识网络的覆盖特征看,知识网络有纵向知识网络和横向知识网络。纵向知识网络是按照学科体系、组织结构体系和其他层次结构体系链接起来的类似于树型结构的知识网络,它是最常见的一种知识网络形式,体现了知识之间的强关联特性;横向知识网络是将异质的、彼此之间没有直接层次关系和关联关系的知识按照兴趣加以链接所形成的网络,称之为横向链接或者“跨学科引用”,如Web网页到Web网页之间的链接,体现了知识之间的弱关联特性。有学者还将这种横向链接方式与范内瓦·布什提出的Memex情报系统联系起来,认为,在Memex系统中,完全不同的文本段落能够通过线索或者轨迹(trails)联结起来,然后存储于已经分好类的体系中,用来刺激研究者的创造性,这种跨越式链接方式和横向链接方式类似,能够提炼出包含于学科交叉部分的新的研究方向,发现新的联系和模式,提供一种创造性的视角[5]。总而言之,横向知识网络是随信息技术的发展、知识链接技术的进步而出现的新的网络形式,由于纵向知识网络墨守成规,难以突破已有知识框架局限,横向知识网络的特点可以作为纵向知识网络的一个很好的补充。

此外还有,从知识网络中的知识类型看,有同质资源知识网络,网络中的知识是同一类型的;异质资源知识网络,网络中的知识包括多种来源和多种类型。从知识网络的涵盖范围看,有单一学科知识网络,多学科知识网络,机构内知识网络,跨机构知识网络,数据库内知识网络,跨数据库知识网络等。

众多的知识网络也可能在相当长时间内并存,但知识网络的发展方向是借助于互联网技术,实现跨学科、跨机构、跨数据库的异质知识资源的互联互通,实现知识的无缝链接、知识的准确定位和快速便利的获取。

3 基于知识链接的知识服务模式

近年来伴随着知识链接和知识网络理论和实践的拓展,各种形式的知识网络不断出现,一系列新型的基于知识链接的知识服务模式悄然出现,它们代表着知识链接和知识服务的发展趋势,以下笔者从目前拥有信息资源最为丰富的三大核心领域:出版商、图书馆和数据库商,说明起源于这三方的三种知识链接和知识服务的新发展。

3.1 起源于出版商的知识链接和知识服务

1994年美国出版商协会组织专门的研究机构,研制一种既能保护知识产权又能保障版权所有者商业利益的系统。1997年在法兰克福图书博览会上,对数字资源的内容能作唯一的命名与辨识的一项标准——数字对象唯一标识符(Digital Object Identifier,DOI)首次亮相,国际DOI基金会(International DOI Foundation,IDF)作为非营利机构来负责政策制定、技术支持、注册及缴纳会费、维护网上的使用指南[6]。

DOI被称为“数字资源的条形码”,它独立于数字对象的物理位置、复本数量、应用系统和存取协议,是数字对象永久的和唯一的逻辑标志符[7]。DOI系统是标识及解析任何数字对象的一种内容识别符系统,主要由编码规则、元数据框架、解析系统、管理模式与有关规则四个基本部分组成。它的出现解决了由统一资源地址URL代表数字对象和链接时常常会因为数字对象的物理位置变化而产生“死链”、数字对象的多个复本和物理位置难以表达的问题,尤其是DOI使数字资源有了唯一性和可跟踪性,可以方便出版商跟踪和定位数字信息,能够反映出对信息的保存、位置、下载、浏览等任何处理活动,方便其获取出版活动的经济利益,并防止出版物被非法复制盗版,维护出版者的知识产权。

CrossRef是由世界顶级科学、技术、医学等学术出版商组成的联盟,是DOI最大代理与应用机构,负责提供已注册DOI的信息存储、解析和检索服务,成员包括ACM、Elsevier、IEEE等著名的出版商和图书馆。加入CrossRef的学术出版商,首先对出版的学术论文用DOI进行标识,然后向CrossRef提交相应的DOI、URL和简单元数据,其中DOI和URL存入地址数据库(Location Database),DOI和元数据存入元数据库(Metadata Database)。用户通过点击参考文献的DOI,即可通过链接CrossRef的地址数据库和元数据库进行检索,获得相应的DOI、URL和元数据,从而获得该论文。CrossRef的目标是建立世界上有史以来最大的链接库[1]。

有了DOI系统,跨出版商、跨数据库的知识可以方便实现互联。DOI系统可以实现包括文摘、关键词、作者、参考文献、脚注等多途径跨库链接。

由于DOI具有唯一性、永久性、驱动性、兼容性、可扩展、互操作、动态维护等特性,可协助解决数字信息资源的版权保护问题,实现跨越数据库和出版商的知识链接,体现以前的知识链接所没有的优势,更符合现代社会对知识获取的要求,更符合行业发展趋势,使用DOI的模式进行数字资源链接可以在更大范围和更深层次内实现不同出版机构间的资源链接。因此,可以认为DOI进行数字资源的链接和解析是今后知识链接和知识共享的发展趋势之一[8]。

3.2 起源于数据库商的知识链接服务

本节中我们讨论的数据库商的知识链接服务限定为:数据库商在自己所拥有的多种数据库范围内提供跨库的知识链接服务,而不包括不同数据库商之间的知识链接服务。这种出版商内部数据库之间的跨库的知识链接服务将多个数据库中的知识通过链接的形式,形成了多种类型的知识网络,极大方便了用户的知识获取。虽然与前述DOI/CrossRef类型的知识链接相比较,这种跨库的知识链接形式属于封闭式而非开放式的,所能链接的知识限制在自己拥有的信息资源范畴内,在整体规划的先进性和可持续发展方面不如前述知识链接形式,但是只要数据库商拥有的知识数量足够丰富,这种知识链接服务形式还是非常受用户的青睐。

我们以清华同方的“中国知网”CNKI为例来说明这种类型的知识链接服务。

“知网节”是中国学术期刊(光盘版)电子杂志社及清华同方知网(北京)技术有限公司和清华同方光盘股份有限公司提出的一种知识整合模式,所谓“知网节”是对知识网络中知识信息交汇节点的简称。一般而言,任何一个事物都可以成为知网节的主体,如一本书、一篇文章、一个作者、一个机构、一个概念等,最为常见的知网节是一篇文章的信息。知网节的表现形式是知网节所表达的主体的详细信息和扩展信息的浏览页面[9],只要点击知网节上的任意链接点,便可实时获得相应的内容。《中国期刊全文数据库》通过提供单篇文献的详细信息和扩展信息的浏览页面作为“知网节”,与旗下拥有的《中国知识资源总库》中的其他系列数据库如《中国重要报纸数据库》《中国重要会议论文全文数据库》等中的知识内容进行多种链接,链接的形式可以是知识元、参考文献、引证文献和相似文献,链接的节点可以有文献、关键词、机构、作者,可以形成知识元链接、引文链接、共引文献链接、二次参考文献链接、相似文献链接以及读者推荐文章链接[10]。因此,通过知识链接可以进一步形成作者网络、机构网络、引文网络、项目网络、关键词网络、分类网络以及主体文献网络、引用文献网络和相关文献网络等多种类型的知识网络。

CNKI知识平台揭示了知识载体的多种特征,在将这些特征进行多维分析的基础上,利用相似性比较、自动聚类、引文分析、关联分析等理论、技术和方法,自动聚集并动态实现各种知识之间的相互关联,生成基于知识特征的知识关联网络[9]。其知识链接的特点表现为:(1)所有链接的信息都是动态的,会随着数据库信息内容的增加而变化;(2)基本实现了利用多种先进技术对海量资源进行深度开发和广度整合的目标,提升了资源的综合和增值利用价值;(3)形成了多种多样的知识网络,方便文献资源发现、获取和高效利用;(4)跨越了不同数据库和不同类型文献之间的界限,保证了所有数据库根据需要形成多类型的知识网络;(5)在方便用户使用CNKI旗下所有数据库中的资源的同时,也提升了数据库资源的利用率。

3.3 起源于图书馆的知识链接和知识服务

图书馆拥有越来越多的二次文献数据库和全文数据库,它们来源不同、语言不同、结构不同、类型不同、收录范围不同,一直以来图书馆都试图通过信息资源的整合技术使图书馆的信息资源形成一个整体,开放链接标准OpenURL的出现为图书馆资源实现真正意义的有效链接和整合提供了可能。

开放统一资源定位器(OpenURL)是一种开放链接标准,可用来创建一组元数据,这组元数据通过网络传递,并被链接解析工具用来将用户指向它所能够获取的每个信息对象的最合适的链接。OpenURL所涵盖的资源类型可以是任意的,包括期刊文章、预印本、书籍、会议文献、论文和专利等,用户还可以自定义新的资源类别。利用基于OpenURL的SFX数字信息资源整合技术,可以实现不同Web学术信息资源的动态链接,使图书馆所有的Web资源形成完全融合的整体[11]。

OpenURL建立在SFX研究基础之上,SFX是上个世纪末期由比利时根特大学的赫伯特(Herbert)和他的同事提出来的,其基本思路是改变元数据中包括全文链接的传统做法,把元数据和对元数据提供链接的服务两者分离开,这样资源的提供者和链接服务的提供者就可以分离开来,与元数据相关的全文链接就可以被看做是建立在元数据基础之上的服务,称为资源调度服务。这种资源调度服务可由多方提供,资源调度的对象也不必限制在一个数据库或者一种类型的资源范围内了。OpenURL可以看做是连接元数据资源和资源调度服务的桥梁,是资源开放链接的实现工具,其目的是提供用户有权访问的资源调度服务,这种资源调度服务通常由用户的图书馆提供[12]。上下文敏感的SPX可以分析用户通过机构的数字图书馆能够访问的所有资源,如文摘索引数据库、电子期刊、OPAC系统、电子出版物系统等,还可分析用户对上述资源的访问方式,分析利用数字图书馆资源时用户的优先考虑[13]。因此,返回的链接是用户所能够使用、并方便使用的资源链接,成为“合适的链接”。

康奈尔大学的Herbert Van de Sompel和美国ExLibris有限公司的Oren Beit-Arie详细描述了OpenURL的框架,他们用一个图形(见图3)展示了元数据平台和扩展服务平台两个平台,OpenURL是一个钩子,能够将拥有元数据的资源与提供用户需要的合适服务的服务组件连接起来[14]。

图3 OpenURL框架图

来源:Herbert Van de Sompel,Oren Beit-Arie,http://www.dlib.org/dlib/march01/vandesompel/03vandesompel.html

OpenURL链接服务主要的特点在于:(1)信息内容的提供者和链接服务的提供者分离,内容提供者只需要提供资源的元数据和上下文信息,链接服务器根据用户的请求来生成所需要的合适的链接;(2)提供了一种手段,让第三方能够提供附加的、适当的链接;(3)动态的、开放的链接方式保证了链接的易用性和可维护性;(4)OpenURL规范提供一套元数据传送机制和对服务请求的解析机制,有效实现了存在的资源和用户请求资源的匹配[15]。

从上述图书馆、数据库商、出版商三方的知识链接和知识服务探索看,知识链接成为未来知识服务的关键因素,这三方的知识链接和知识服务虽然来源不同,实现的思路也不同,但不同知识链接形式之间的融合和协作的理论与实践已经起步,比如CrossRef/DOI与OpenURL/SFX的协作已在图书馆中被应用。

4 结语

知识链接的理论和实践发展飞速,并且给人以震撼,笔者可以预见:

第一,未来的知识链接目标是集合多种知识链接技术,形成多元化、可用性、可视化、用户体验好的知识网络,来实现全球范围内的、不同类型的知识资源的无缝、快捷、有效的链接。

第二,未来的知识链接技术和相关规范的发展带给数据库商、出版商、信息服务提供商、图书馆、数据资源中心的不是量的变化而是质的飞跃,知识的发布、知识的服务和知识的获取将因此而产生变革,带来知识出版方式、知识版权管理、知识服务赢利模式、知识利用规则等一系列相关领域的深层变化,决策管理层以及这些领域的利益相关方必须对此给予高度关注并制定相应的发展对策。

收稿日期:2010-01-30

标签:;  ;  ;  

知识网络、知识链接与知识服务研究_元数据论文
下载Doc文档

猜你喜欢