论知识组织的三个层次,本文主要内容关键词为:层次论文,组织论文,知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
知识组织的雏形可以追溯到19世纪末20世纪初的文献分类与编目领域的研究活动。这一时期的研究将文献不仅分解成比较小的书目单元,而且可以分解成比较小的信息单元。这些信息单元被分析著录后加以重新组织以备检索[1]。这些研究将知识组织等同于文献的分类和编目。知识组织理论可以应用于图书馆的传统工作,但绝不等同;它可以应用于知识存取;但不是做表面的知识化罗列而是要对知识内容进行组织。近几年的知识组织理论研究主要局限于具体技术方法问题,缺乏深度理论研究[2]。目前的研究在总体上呈现出重技术轻理论、重微观轻宏观的倾向,至今尚未形成知识组织理论的完整体系。
1 知识组织概念的演化
知识组织(knowledge organization)一词最早由美国著名图书馆学家、分类法专家布利斯(H.E.Bliss)于1929年提出。透过其《知识组织和科学体系》、《图书馆内的知识组织》、《书目分类法体系》可知,布氏的主张是一种基于图书分类的知识组织雏形,观点具有预见性,但限于纯粹的实用角度[3]。1989年,国际知识组织学会成立,后将其学术刊物《国际分类法》更名为《知识组织》。此后学者开始关注知识组织。英国的布鲁克斯从“认知地图”的角度探讨知识组织,印度的赛恩(S.K.SEN)提出“思想基因”的观点、美国的德本斯从情报学的角度解释知识组织[4]。在美国,知识组织就是指对文献的分类、标引、编目、文摘、索引等一系列整序活动[5]。我国最早提出知识组织一词的是袁翰青先生。他在1964年的《现代文献工作基本概念》中指出:“文献工作实际上有两个方面:知识组织工作的一方面和情报检索工作的一方面”[6]。近20年来,马费城、王知津等一大批学者对知识组织做了进一步研究。
知识组织在我国尚未形成统一的概念。陈树年认为:“从信息的内容角度研究信息组织时就称为‘知识组织’,知识组织一般是指对文献信息的整序由文献单元深入到‘知识单元’”[7];蒋永福认为:“知识组织是指为促进或实现主观知识客观化和客观知识主观化而对知识客体所进行的诸如整理、加工、揭示、控制等一系列组织化过程及其方法”[8]。王知津认为:“知识组织所研究的最小单元是概念及其词语表达”[9]。邱均平等将数字图书馆的知识组织阐释为“在信息获取和信息预处理的基础上,通过知识挖掘,对信息进行精简、提取、发现隐含在信息中的有用知识单元,并对其进行集合组织的过程[10]”。
知识组织概念的复杂性首先源于知识、组织概念的复杂性。知识有主观知识与客观知识之分。主观知识也称隐性知识,是存在于人们大脑之中的个人经验、技能、洞察力等。客观知识也称显性知识,是存在于文献之中的信息,是可以被表达和编码的知识。组织一词的含义更为丰富。《英汉大词典第二版》对组织的解释共有六个义项:(1)组织;把……编组。(2)把工人等组成工会;把……组织起来。(3)使具有有机结构;使成有机体。(4)使有条理、使井然有序。(5)使自己头脑清醒;使紧张有序。(6)设法获得。
从知识与组织的含义中来理解知识组织:其内涵及外延应包括“对文献的分类、标引、编目、文摘、索引等一系列整序活动”,也应包括“对知识单元及知识关联的揭示与表达”,还应该包括“知识节点与知识关联的揭示控制、知识产品的管理与社会知识工程的统筹”等。因此,知识组织的含义应有狭义与广义之分,狭义的知识组织是指对于知识单元的组织,即对知识节点及知识关联的组织,最终生成一定的知识产品,如文献、电子文档等。广义的知识组织是指对文献、数据库、网站等的组织。
2 知识组织的层次划分及其影响因素
知识组织含义的复杂性为人们使用这一概念制造了不小的麻烦。如何区别对待和使用这一概念并减少交流的障碍就显得十分重要。从宏观、中观、微观三个不同层次探讨知识组织的不同含义和内容可以更加全面准确地把握其本质。当然按照不同的划分依据,知识组织的概念和理论体系还可以有不同的划分结果。无论具体的结果怎样,主客体、组织工具、组织目的等都是影响知识组织的重要因素,应一并加以讨论。
2.1 知识组织的层次构成
早在1946年,学者杨家骆重申了李石曾对《世界学典》编撰方法论中关于整体和单体的关系主张[11]:其一为“金字塔式”,由占有广大面积和数量繁多的基石为底,向上逐层缩小,堆至高插云霄的尖端。其二为“细胞分裂式”,由一个分裂为两个,两个分裂为四个,四个分裂为八个……以至无穷多个,这象征着学术的分科愈来愈细的情形。其三为“瀑布式”,即出于现实的需要,利用已有基础,先编成一册包括各种学科的普通学典,将来再把它扩充为各科的专门学典,犹如瀑布泻至中途,渐次散开。很明显,金字塔式表现的是整体和单体的宏观联系;细胞分裂式表现的是单体与单体的微观联系;瀑布式表现的是中观联系。
知识组织的概念和理论体系是一个包括微观、中观、宏观三个层次的结构系统。处于最基本层次的是微观知识组织,包括知识节点和知识关联的知识组织。处于中间层次的是中观知识组织包括文献、电子文档层面的知识组织。处于顶层的是宏观知识组织包括数据库、机构(图书馆、企业等)、社会知识工程的知识组织。知识组织可以按照微观、中观、宏观分成三个层次进行概念展开与理论构建。
2.2 知识组织的影响因素
2.2.1 主客体因素
主体因素即人的因素,又可分为知识的提供者和知识的使用者。知识使用者的需求可能是浏览、查找、学术写作,也可能是专深的学科知识。根据知识使用者的不同需求给予不同程度的指导;或提供文献单元,或提供知识单元。知识的提供者必须充分理解知识使用者的需求。客体因素包括技术因素、标准因素、政策法规因素。从技术的角度来看,影响知识组织的技术有知识发现技术、知识描述技术、知识检索技术等。从标准的角度来看,知识组织过程中涉及的标准有数据转换标准、数据编码标准、元数据标准、本体构建标准、访问控制标准、互操作协议标准、知识共享与创新标准等。政策法规是知识组织的社会大环境因素,往往是一定时期知识发展水平的反映[12]。
2.2.2 工具因素
它包括传统的知识组织工具与网络的组织工具。前者是情报检索语言在传统图书馆、情报资讯系统具体应用中的表现形式。后者还包括两层含义:一是传统知识组织工具的网络化;二是针对网络信息资源内容以新结构方式组织的语义工具,如面向领域概念空间架构的知识本体、面向概念检索的主题图、面向网页检索的主题网关等[13]。
2.2.3 目的因素
一是用于组织文献单元。图书馆对文献单元的组织,对知识的标注方法都已经成熟,难于有更大的突破。图书馆文献单元的知识组织本质上最终为读者提供的只是相关的文献线索或原始文献的集合[14],对于知识内容的提供甚为困难。二是用于组织知识单元。对知识单元的组织不仅要关注知识单元的外部特征,同时要关注知识单元的内容特征。
3 微观知识组织
微观知识组织是中观与宏观知识组织的基础,是知识组织过程中对知识节点以及知识关联的具体研究。长期以来人们一直在寻找一种可以对知识的底层进行组织的方法,即可以将知识打碎,然后再进行重组、检索与利用。
3.1 组织类型
微观知识组织的类型包括知识节点和知识关联的组织。人们借助计算机描述与揭示底层知识。加拿大学者Saumure和Shiri把知识组织按浏览器出现的时间分为前网络时期与后网络时期,前期注重表层特征的研究;后期注重内容方面元数据的研究[15]。刘洪波指出:“社会控制能力的极限就是图书馆知识组织逼近公共知识结构的极限,知识工程的极限就是图书馆接近个体知识结构的极限”[16]。微观知识组织不仅要揭示知识资源的内外部特征,还要揭示知识单元之间的关系,特别是有价值的关联。
知识节点的表现形式是概念。知识的底层组织就是要研究在概念→理论→新概念形成中的知识节点的产生及知识关联的理解。概念是事物本质属性的概括。概念的内涵即概念的含义。概念的外延是概念的适用范围。概念之间存在的多种关系被称为知识关联。由知识到知识节点形成的过程是知识显化的过程[17]。知识节点隶属于一定的知识系统,相对稳定。知识节点又形成知识关联。以静态的形式存在的知识节点,它们之间的关系存在同一性关联(一致性)、隶属性关联、相容性关联[18]。从动态的角度看,其关系则有融合关系、分解关系与替代关系。
3.2 研究内容
微观知识组织的目的是以知识节点及知识关联的知识发现为目的而进行的。微观知识组织的工具主要用于组织底层知识及其关联。传统的知识组织工具在微观知识组织中显现出多种局限性。因此微观知识组织的工具有两种形式,一种是基于传统知识组织工具的改造,一种是语义工具,包括语义网、本体等。在用途方面,微观知识组织用于组织知识单元。
3.3 研究方法
对知识节点的知识组织,是将概念按照其相互关系进行组织,通过对概念的划分与概括(分类)完成对概念的内涵的扩大或缩小;通过对概念的分析与综合(组配)实现对概念外延的融合或分化。从逻辑形式上看底层知识以线性、树型、网状进行排列。
从底层知识的运动状态看,它是以一种类似基因的方式存在着:融合→分化→融合→分化→死亡(分化)。底层知识及知识关联的知识发现是其主要目的。知识发现是数据挖掘的一种广义应用。文献信息的知识发现对于知识组织十分重要,不仅要关注相关文献的知识发现;更要关注非相关文献的知识发现。Web网络中的知识既有结构化知识又有非结构化知识。在这些异质的、海量的、非结构化知识中发现有价值的知识信息具有重要意义[19]。
4 中观知识组织
中观的知识组织处于宏观和微观之间,主要是对文献、电子文档层面的研究。图书馆学情报学长期专注于文献层面,形成了一系列理论。文献与电子文档不是孤立存在的,可以通过相互转换而得到丰富和发展。中观知识组织以微观知识组织过程中发现的知识为基础,通过对文献与电子文档的知识描述进而动态地形成宏观知识组织的内容资源。
4.1 组织类型
中观知识组织是对文献与电子文档的组织,相应的类型也是文献层面的组织与电子文档层面的组织。
4.1.1 文献层面
图书馆的知识组织工作一直以来都是围绕着文献进行的。数字图书馆将纸质文献数字化,并对数字化与非数字化的资源进行组织。图书馆文献层面的知识组织分为两种。第一种是以馆藏文献为实体而进行的知识组织,即排架。而排架号是对实体的抽象,是实体的替代物。第二种是以知识单元为对象而进行的知识组织。图书馆在对文献组织的过程中也关注到了知识单元的层面,但没有深入到文献的底层而只是对知识的初步加工与揭示。
4.1.2 电子文档
电子文档层面的知识组织是基于微观层面的数据的知识组织而进行的,通过对电子文档数据(txt、pdf、caj、doc、ppt等格式)的管理形成初步的目录式系统,满足用户对电子文档存取管理的基本需求。个人电子文档的组织都是以电子文档为基础进行的再组织过程。如中国知网提供的个人数字图书馆管理软件以及其他内容管理软件。这是数字图书馆与个人电子文档管理的结合体。网络置标语言适用于网络文档的组织。
4.2 研究内容
从目的看,中观知识组织以知识描述为目的。从工具看,中观知识组织的工具主要用于组织文献和电子文档。传统的知识组织工具(分类法、主题法)可以满足中观知识组织的需要,而且传统知识组织工具在中观知识组织的过程中也在不断改进与演变。从用途看,中观知识组织比微观知识组织要粗糙,主要用于组织文献单元与电子文档的初步存取。
4.3 方法
(1)文献的知识描述方法。分面分类法是知识描述的典型方法,它是“依据概念的分析与综合原理,将概括文献与事物的主题概念组成‘分面—亚面—类目’的结构体系,通过各分面内容类目之间的组配来表达文献的一种文献分类法”。分面组配分类法从知识范畴的角度将概念分成了若干个面、层、相,构成了一个具有相关性、层次性、系统性的概念体系,这实际上也是一种由概念构成的知识体系[20]。而知识复分是以辅助方法对知识体系进行描述的方法,通过使用复分表增加时间、地区、民族、年代等辅助知识加以补充。
(2)电子文档的知识描述方法。现阶段采取HTML\XML、元数据、语义的方法进行描述。HTML是对静态网络信息知识进行描述的方法,XML可扩展标记语言是对静态及动态等网络信息知识进行描述的语言,可扩展性强。元数据是对数据进行描述揭示的手段。语义的方法是揭示网络信息知识语义关系的方法。
(3)通用的知识描述方法。MARC是使用计算机对文献进行描述的手段,现阶段MARC数据也可以描述光盘信息、网络信息等,但也有不可详细揭示的局限性。FRBR是IFLA开发的一种实体——关系概念模型[21]。传统的描述方法与新的描述方法都处于发展融合之中。
5 宏观知识组织
宏观知识组织是知识组织的社会化,有数据库、机构(图书馆、企业)、社会知识工程等方式。宏观知识组织的目的是对知识进行表达并最终进行知识的共享、传递与创新,形成知识的生态循环。
5.1 组织类型
宏观知识组织是从宏观的角度系统地组织社会知识的过程。宏观知识组织的类型有数据库、机构、社会知识工程三种方式。
5.1.1 数据库方面
网络技术的发展极大地推动了知识组织的进步。Web2.0的产生使网络由静态走向了动态时代。Blog、RSS、WIKI等具有2.0特色的服务在图书馆中得到了应用,使得图书馆进入知识组织时代成为可能,也使各类型的数据库在图书馆中得到了广泛的应用。
数据库是对数据、符号、文件等进行知识组织,给予统一的管理。数据库的结构分为物理数据层、概念数据层和逻辑数据层三个层次,体现了数据库对知识的组织与调取层次。物理数据层是数据库的最内层,是物理存贮设备上实际存储的原始数据的集合。概念数据层是数据库的中间层,是数据库的整体逻辑表示,指出每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。逻辑数据层是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。数据库不同层次之间的联系通过映射进行转换[22]。
数据库对底层知识有多种组织形式。一种是以字段的形式对知识进行存取,通过I/O流对数据进行存取,但是对于大段文字的处理乏力;一种是通过映射的方式对底层知识进行处理,有字段映射和对象映射两种方式。字段映射将大段的文本或图片、视频等信息映射为数据库中的字段。对象映射是通过建立ISO映象对数据以对象为单位进行处理。将知识以XML,PHP等格式存取于文件当中,通过映射源文件来进行存取,并对其通过元数据进行定义来进行描述,进而实现对底层的检索,TXT文本方式是较好的一种。但TXT文件不是结构化的文件,不利于检索知识,尤其是知识关联;对于PDF、图片、视频等格式无法直接读取,需要建立接口才能实现交互。
5.1.2 机构方面
图书馆是知识组织的发源地。企业及其他信息机构的知识组织也应用图书情报领域的方法来进行。一些企业、信息机构还将分类法、主题法与元数据、语义等组合成统一的知识组织系统。最常用的是简单知识组织系统(SKOS)。目前已有一些叙词表尝试采用SKOS描述,如英国档案叙词表(UKAT)。国内学者尝试将主题词表、叙词表用SKOS进行描述,实现不同叙词表间的映射,实现叙词表到本体的转换。还有学者提出对基于SKOS构建的知识组织模型中的类与属性进行扩展,增强对知识的描述能力。机构的知识组织旨在促进显性知识与隐性知识间的相互转化及利用。要为机构内部成员提供可用的知识,确保知识的可获得性,就要确定知识在组织内部可以顺畅的交流。
5.1.3 社会知识工程方面
从古至今都存在这类社会知识工程,对社会知识进行系统的梳理。明代编撰《永乐大典》、清代编修《四库全书》等都是对当时的社会知识的总结与整理。今天的知识门户网站建设、数字图书馆工程等皆属此类。
按照其载体形式分为两种,一种是以纸质载体形式组织的社会知识工程,包括类书、丛书、百科全书、教科书等;另一种是以数字化资源为载体的社会知识工程,包括数字图书馆、数据库、学科信息门户、网站等,其内在机制是对人脑的识记、保持、再现的记忆机制的模拟。
5.2 研究内容
从目的上看,宏观知识组织的最终目的是知识的表达、共享与创新。从工具上看,宏观知识组织的工具主要依靠行政法律手段予以支持。从用途上看,宏观知识组织主要用于社会知识的梳理、整合。
5.3 组织方法
知识表示是宏观知识组织活动的根基,是以计算机能够接受并进行处理的符号和方式来表示人类的知识。宏观知识组织以知识的再利用为目标,通过知识表示可供研究人员理解,进行知识共享活动来促进知识的交流。知识创新是宏观知识组织达成再利用、再循环的基本方法,是宏观知识组织追求的目标。
6 结语
鉴于知识组织的复杂性和发展性,我们提出从微观、中观和宏观三个层次全面系统地理解知识组织的概念与理论体系。微观层次的知识组织是目前探讨的热点,底层知识的知识发现研究是亟待解决的问题。只有微观层次的知识组织理论得到发展才能使中观知识组织得以突破和发展。中观知识组织因图书馆和网络的长足发展而趋于充分展开,知识组织的手段与方法比较明确稳定。而宏观知识组织的研究还不够系统,未来的研究要充分关注其社会层面及人文层面的研究。构筑一个微观、中观、宏观三个层次相结合的知识组织理论框架对于全面系统地进行知识组织的认识与研究是必要的。
收稿日期:2010-09-10