知识地图在图书馆参考咨询中的构建模式研究,本文主要内容关键词为:图书馆论文,模式论文,地图论文,知识论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
知识地图(Knowledge Mapping)的研究自20世纪末开始得到广泛关注,研究文献主要包括知识地图概念的研究,知识地图类型和功能,知识地图的构建和应用研究。而国内外对知识地图特点以及评价指标的研究尚显薄弱。
知识地图是一种良好的工具,可以实现图书馆知识资源的可视化配置,明确知识的分布以及分布于不同空间的知识资源间的内在联系。图书馆参考咨询系统中的请求管理器根据知识地图就可以快速找到合理的知识匹配,并能对读者的咨询进行反馈,同时提供协作检索以提高咨询服务的质量。知识地图对图书馆参考咨询工作具有重要的意义,本文将从知识地图界定和构建方法、知识地图在图书馆参考咨询中的构建模式和知识地图构建面临的主要问题三个方面进行探讨。
1 知识地图界定和构建方法
1.1 知识地图的界定
知识地图这一术语最早是由行为主义心理学家托尔曼(E.Tolman)所提出。托尔曼认为这种认知地图在人类身上也同样存在[1]。随后,英国情报学家布鲁克斯(B.C.Brookes)最先提出了运用认知地图原理组织知识的设想。
有关知识地图的概念目前尚无统一的定义,目前在图书情报领域知识地图为“知识导航系统说”或“关系说”[2]的界定较被认同,概括如下:知识地图是一种帮助用户知道在什么地方能够找到知识的知识管理工具,并且是已经获取的知识以及知识之间关系的可视化描述,它可以使不同背景的知识寻求者在不同的详细程度上学习知识,并同其他人进行交流[3]。
布鲁克斯的知识地图思想提出之后,人们意识到知识地图的绘制应该具备如下四个条件:(1)整理出一部较完备的知识概念词典,并且它有可修改和扩充的特性;(2)对大量的表征情报元进行模糊分割和模糊标引的自动处理系统;(3)可供建立“认识地图”和表示系统的软件工程环境;(4)可供使用的智能计算机和海量信息存储部件。
1.2 本体论(Ontology)的作用
本体论(Ontology)被广泛应用于知识表示、信息检索、知识管理等领域,并取得了良好效果。本体论(Ontology)是哲学概念,它是研究存在的本质的哲学问题。但近几十年里,这个词被应用到计算机界,并在人工智能、计算机语言以及数据库理论中扮演着越来越重要的作用。然而,到目前为止,本体论还没有统一的定义和固定的应用领域。斯坦福大学的格鲁伯给出的定义得到了许多同行的认可,即本体论是对概念化的精确描述[4],本体论用于描述事物的本质。本体论是概念化的详细说明,一个Ontology往往就是一个正式的词汇表,其核心作用就在于定义某一领域或领域内专业词汇以及他们之间的关系。在一系列概念的支持下,知识的搜索、积累和共享的效率将大大提高,真正意义上的知识重用和共享也成为可能。
本体论的优势在于:通过概念和词间关系实现智能检索,不需复杂的布尔逻辑规则;如果是多语种的本体论,还可以实现以自己熟悉母语检索其他语种的同类检索,提高查全率和查准率。语词的概念结构为知识的表示带来了新思路,它以语言学、心理学、哲学、逻辑学和数学为基础,能够描述出知识的网状结构特征,这对于知识处理从以数据处理为主的低级阶段向以知识处理为主的高级阶段的转变有重要意义。知识地图是一种特殊的概念图,是基于概念结构的一种语义模型。知识图为构造专家系统提供了知识表示的方法和推理机制;知识地图对知识获取和分析、文本分析、机器翻译以及中文信息自动抽取系统提供了理论和技术支持。
1.3 知识地图构建方法
图书馆知识地图的实现主要包括两方面:一是图书馆知识资源目录的建立,根据图书馆知识资源的组成建立的,不同于传统的图书馆典藏目录,既要包括图书馆的显性知识资源,也要包括隐性知识资源;二是描述知识资源目录内各知识资源间的有机联系和描述知识资源因素款目间的有机联系,如各类文献、内部资源与外部资源、传统载体与现代载体、人与文献、馆员与读者、图书馆与馆员间的多种联系。
2 知识地图在图书馆参考咨询中的构建模式
2.1 知识地图内容
一个完整的知识地图包括知识资源的存储地点、所有权人、有效性、主题范围、检索权利、存储媒介及使用渠道等,并能揭示所有的知识资源如文档、文件、系统、政策、名录、能力、关系、权威及专利、时间、实践经验等。一个完整的知识地图就要包括这个咨询系统所拥有的学科知识内容目录、对所有知识进行描述的款目以及各知识内容之间的相互关系线路。学科知识目录可以按分类法或主题法两种方法进行组织,分类法制作相对容易,但缺点也很明显,就是无法揭示不同知识之间的内在联系。最好是从语义联系的角度即主题来组织知识地图,以便于建立各类知识之间的联系。
2.2 文献聚类(Document Clustering)代替文献分类
传统的知识地图构建采用文献分类的方法,如参考《中图法》的分类体系等。信息科学最近的研究倾向于文献的自动分类。然而,由于人类的专家不能先于知识的产生而对文献进行分类,所以文献的聚类比文献分类更有挑战性。聚类任务有较高的自由,也就是说,分配决策也决定创建多少的聚类,以及每个聚类分配多少文献[5]。文献聚类的过程包括两个主要任务:文献表征和聚类。聚类的方法通常可分为三种类型:分区(partitioning)、层次(hierarchical)、混合方法(hybrid approaches)[6]。采用聚类的方法,读者可以选择其所需的合适的聚类的层次。优越于传统的文献分类模式。
2.3 可视化在知识地图中的应用
现代的数据可视化(Data Visualization)技术指的是运用计算机图形学和图像处理技术,将数据换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及计算机图形学、图像处理、计算机辅助设计、计算机视觉及人机交互技术等多个领域。数据可视化概念首先来自科学计算可视化(Visualization in Scientific Computing)。
知识地图要用可视化的技术展现出来,既可以选择传统的目录等级层次,也可以采用树形结构或者更好的网状结构。知识地图最简单的层次就是知识资源目录之间的网状联系,知识目录应周密细致,采用合理的知识分类方法,便于请求管理器遵循一定的知识分类体系找到合适的知识资源。
接近是指人们如何感知知识元素的组和空间,它是知识地图设计最有用的原则。用户可以很容易区分显示屏上的组或聚类。如图1,空间的点看起来就像两组,信息可视化界面可以形象展示出知识元之间的空间关系,同一组的知识元具有相似的属性[7]。
图1 接近(proximity)的例子
2.4 知识地图构建工具和步骤
知识地图的辅助工具主要有Onto lingua Server、Onto Edit、China era等。其描述语言比较有名的有Ontolingua、CycL、OL、OWL等。庄善洁认为:可利用知识地图建立用户易用的智能化导航系统,用户在浏览的同时发表评论,通过知识地图平台进行隐性知识交流,能够为组织创新提供条件,利用知识地图进行知识重组,可为知识服务提供良好的服务平台。学术界对知识地图构建模式的理解不尽相同,如吴岩等的三步构建法;陈远等的四部构建法;Eppler的五部构建法;William等的六部构建法;庄善杰的七步构建法[1],但总的来说可以概括为两条主线:一条是识别组织知识资源、确定知识点及其分类标准、建立知识间的联系、知识地图的可视化表示;另一条是识别关键用户群,并明确用户的需求;明确知识地图的目标、使用范围、基础结构、构成要素、节点关系的定义、链接数据的存储方法等;评价和选择开发工具;确定知识地图的管理者、维护程序等。
2.5 知识地图的管理图
图书馆参考咨询知识地图的模式通常具有三项功能(见图2):知识地图的维护,是核心;知识地图的导航;知识检索的协作功能。知识地图要想持续的实现读者的信息咨询,就要不断地把图书馆中新的各类文献资源纳入知识地图管理范畴,供用户知识搜索;同时知识地图界面通常采用可视化技术,界面非常友好,并提供导航功能,方便读者使用;而且知识地图还具有用户的检索历史的记录功能,通过分析其检索记录,针对其检索过程中可能存在的漏检和误检等问题,图书馆参考咨询人员将能适时的提供检索改进建议。图书馆参考咨询知识地图就是这样动态的运行。
图2 知识地图的管理结构图
3 知识地图构建面临的主要问题
3.1 知识元的选取和描述
图书馆的参考咨询系统要想成功构建知识地图,第一步也是最重要的一步就是选取和描述知识元,从“知识元”层面研究文献知识的计量与管理,揭示单篇文献个体中的“知识元”信息与某领域共性中的“知识结构”的链接关系,从而找出信息与知识的导航链接的普遍规律,为用户提供直接获取有效知识元而不是大量文献的有效方法。因此,知识元计量与管理是知识地图构建的起点。
知识元选取和描述中存在着以下问题:第一,目前“知识元”这一概念是抽象的、不确定的,即具有不确定性和不稳定性,还不能清楚地界定;第二,知识元的长度、来源、识别、组合等十分模糊,导致在知识元标引、组织、存储、检索、利用等方面尚不具有可操作性,特别是计算机自动处理;第三,知识元的基本构成单元仍然是以字、词、句、段、全文中的主题知识概念等为基础。难以脱离文献单元和信息单元,也就是说,知识元应该是一个最小的表达一个完整知识概念的独立单元,它最终还是由一个或多个主题词、关键词等组合而成。因此,对知识元的明确界定、知识元的有效提取和可操作性是目前要解决的关键问题。知识元的发展不仅面临着本身的缺陷和瓶颈,还要解决和克服来自知识利用习惯和社会成本等方面的压力[8]。
3.2 与数据库的融合
图书馆参考咨询知识地图的构建除了需要链接图书馆文献管理系统的图书和期刊信息,也要链接图书馆已购买的各类数据库信息,而各类数据库都有自己固定的检索知识元,如妙思管理系统的检索字段是题名、作者、出版社、分类、主题词和ISBN等;而CNKI期刊数据库的检索字段是主题、篇名、关键词、单位、摘要、作者、刊名、参考文献和全文等;而学位论文的检索字段通常是主题、题名、作者、关键词、摘要、作者单位、导师、论文级别、学科专业名称和学位授予单位等。不同的文献类型和数据库的检索字段也不尽相同,因此,图书馆参考咨询知识地图的构建要适应各种文献类型和数据库的检索界面,要有效地把各种信息资源整合起来,使读者能比原来更高效的检索到所需资源,并非链接到数据库检索界面,而是通过图书馆参考咨询的知识管理平台的检索,直接进入各数据库知识检索结果的界面,要实现这一目标,就要协调图书馆和各数据库公司的检索界面,使各检索字段具有更好的兼容性。
3.3 读者的交流与隐私保护
图书馆参考咨询的知识地图除了能给读者
提供合适的知识元之外,一个重要的功能就是能
实现读者之间的交流和学习。要实现这一功能,参考咨询的知识地图必须具有记录读者查询和使用知识的功能,因此,读者在实现知识交流和学习的同时,也不可避免的了解到对方的隐私。如果仅从知识学习和交流的角度,这一功能是非常有效地,前面读者的信息能够对后面的读者进行指引;但是如果两个研究人员的研究非常相近,而且科研进展差不多同时的话,尤其是专利方面的研究,这时别的研究人员的参考文献可能会对其产生很大的促进作用,也许会发生意想不到的结果,后面的研究人员由于受到了启发产生了顿悟,先完成其科研成果,申请了专利,就会造成对前面科研人员利益的隐性损害。所以知识地图如何在实现交流的同时有效保护读者的隐私,将是图书馆参考咨询知识地图构建面临的一个重要问题。
收稿日期:2009-12-22