试论我国高校知识服务型数字图书馆建设,本文主要内容关键词为:服务型论文,试论论文,数字图书馆论文,高校论文,我国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
知识服务型数字图书馆是把传统的文献信息服务通过现代智能信息技术转变为知识服务。而知识服务不再是原始形态、初级形态的文献信息提供,而是高级形态的知识提供,是在语义层面或知识层面对文献信息、数据等进行组织加工、挖掘、浓缩、重组以及形式变换,并以高度集成化的分布式网络平面传递这些数字资源。
知识服务型数字图书馆是借助智能信息技术实现知识的创新和知识的增量,它是把传统文献信息服务推向高级形态的知识服务,知识服务将是面向实际需求的、有效的和针对性的,是连续性的、深层次的、更高级形态的。这种能够提供知识服务的数字图书馆是数字图书馆发展的高级形态,是知识服务型的数字图书馆。
1 知识服务型数字图书馆建设的主要内容
1.1 知识库建设
知识库是由经过加工、组织过的知识信息构成的具有知识挖掘功能的数据库,它是经过分类加工、组织和序化处理的知识集合。
专业知识库是按一类具有相同知识信息需求的机构的知识结构特征和层次范围,从特定的信息源中经过筛选、分类、重组、编辑而成,且动态转变成为更新的数据库。知识库是专业知识库的集合。
知识是信息,是经过整理、加工、提炼的信息,高校图书馆可以通过对特定领域和范围内的知识进行说明性、直接式、可视化等多种方式的表达,并经过组织、加工、整序、重组、建立一些特定的专业知识库。如,河北科技大学已经开发建设的“药物研制知识库”。
高校图书馆应充分利用已有的数字资源,建设相应的知识库,在建知识库前,应考虑制订本馆的建库标准,如:①知识库的应用范畴;②专业知识库的内容结构体系和知识链接;③信息的采集范围;④知识库内容的质量指标等等。
1.2 知识网络建设
知识网络是基于引文链接和知识元链接,把所有的全部数字资源集合关联成为一个整体化的网络。
1.2.1 引文链接
高校图书馆通过已有的数字文献之间的引证关系,直接从数据库中得到引证线索和引用数字文献的全文。通过引文链接方式建立知识信息之间的内容关联,是深度开发利用知识信息资源极为有效的手段。高校图书馆应该把中外文期刊目次库、题录库、摘要库、全文数据库、书目数据库、多媒体视听库等进行引文链接,尽快建立起具有本馆特色的知识库,高等院校图书馆还可与CNKI等工程合作,与其各知识库建立引用、被引关联,使用户通过互联网查询存放在各数字化图书馆网站上的引文链接数据库,通过各种引用途径在整个知识网络中最大限度地系统地获得相关知识信息。
CNKI目前已经实现了200多万条的引文记录,并与外文数据库链接成功。引文链接通常分为引文正向链接、引文反向链接和共引文献聚类链接三种。引文正向链接检索可发现已有知识和相关知识;引文反向链接检索可发现新知识和关联知识;共引文献聚类检索可发现关联知识。
1.2.2 知识元链接
知识元是对某一知识的最为完整的描述、知识元之间相互链接构成知识元数据库。知识元数据库是内容链接中枢,它不仅可以直接表述知识的内容,还可以通过全文数据库的索引技术将使用这一知识元的所有数字文献信息自动链接成为知识网络。
高校图书馆还可以利用对某个知识元的描述,建立知识元之间的内容关联,将大量、不断更新、不断出现的知识元建成知识元数据库,再把知识元数据库嵌入到各种数据库当中,把数据库内部和各种数据库之间的知识信息从内容上紧密关联起来,使所有数据库在知识元数据库这一神经系统网络的支配下成为一个内容高度集合而又相互关联的有机整体。
1.3 知识平台建设
1.3.1 知识访问平台建设
知识访问平台建设是知识服务型数字图书馆的重要组成部分。它主要解决异构平台的数字知识资源的检索,为用户提供方便可行的统一界面,提供不同数据库的互操作,使用户检索知识时不需要分别进入各个不同的数据库就可以快速查到所需要的数字化的知识信息。如:CNKI研发的分布异构统一检索平台(USP)能够高效地整合网络数据库资源,提供不同结构的数据库进行统一、并发的检索,即用同一主题便可同时检索不同的数据库,毋须多次换库。不但检索方便、快捷,检索结果也准确。USP并不要求做检索的数据库必须支持Z39.50、OAI或OpenURL协议,从而实现了对不同数据库的高度、有效整合,使整个数字图书馆连成一个整体。
1.3.2 建设基于Web Services技术的网络平台
Web Services技术以XML技术为基础,是在现有的各种不同平台的基础上构筑一个通用的、与平台无关、与语言无关的技术层。Web Services的体系结构由Web Services提供者、Web Services请求者、Web Services中介者3个基本角色构成。这三个基本角色通过Find(发现,相当于目录)、Bind(结合,相当于传输)和Publish(发布,相当于界面)操作进行交互,主要技术有XML Schema、SOAP、WSDL和UDDI。XML Schema为在不同系统(Web Services)之间交换数据提供了一个核心的数据建模工具。SOAP为在不同系统之间实施平台无关的交互定义了一套基本的元规则,SOAP是Web Services体系中服务交互的基础架构。WSDL则是描述Web Services界面的基本工具,依靠WSDL、Web Services的交互界面就能被系统自动处理。UDDI是Web Services的目录服务工具,依照UDDI的协定,提供发布和查找服务描述的方法。Web Services通过WSDL对所提供的服务进行描述,并将这一描述告知Web Services注册服务器。注册服务器依据WSDL的描述,依照UDDI的协定更新服务目录并在因特网上发布。用户在使用Web Services前先向注册服务器发出请求,获得Web Services提供者的支持。各种不同平台之上的应用依靠这个技术层来实施彼此的连接和集成,从而可把现在以传输知识信息为主要功能的因特网变成到处可实现计算资源、存储资源、信息资源、知识资源等全面共享的网络。Web Services是新一代的 Internet Services,是建设知识服务型数字图书馆的基础网络平台。
1.4 知识服务系统建设
1.4.1 知识采集系统
知识采集系统的主要任务是完成文献信息资源的加工整理、完成文献信息到知识之间的转换功能。知识采集系统包括两个主要部分:印刷本知识采集系统和数字知识采集系统。其中印刷本知识采集系统的功能是完成印刷本载体上的知识的采集工作,其工作主要由人工辅助来完成,或者首先把印刷本文献资源转换为数字形式的信息资源,然后再利用数字知识采集系统进行采集。因此它的采集过程可以方便地参照数字知识采集系统进行。数字知识采集系统完成电子资源的知识采集工作。目前,Internet上的数字资源是最大的数字资源库,针对网上不同价值和形态的资源,可采取不同的采集手段,特别是对于资源相当丰富、采集价值较大的数字信息资源,利用该组件完全下载到本校图书馆且保持原站点的结构,然后进行采集,以提高采集速度。数字采集系统将采集到的资源转换为知识,对数字资源进行智能标引,分类生成不同形式的知识,也就是分解成知识元,然后分别进行表达,为进入系统知识库作好准备。
1.4.2 知识处理系统
知识处理系统负责将采集到的文献资源进行知识化的处理,包括自动处理和手工处理两种方法,内容包括文种代码的识别和转换、资源格式的转换、资源分词标引、智能词表、知识查重过滤、知识标引、文摘生成、文档分类聚类处理。并对已经作过加工过滤的知识与知识库中已有的知识进行智能的分类与匹配,然后把符合进入知识库条件的知识按特定要求存入知识库。知识库中的知识就是这样不断地更新和补充的。
1.4.3 知识库存储系统
知识库存储系统是知识库建设的最重要的组成部分,它关系到知识服务的效果和质量。因此知识库的设计是知识服务系统的核心内容之一。知识库存储系统包括:硬件系统设计、软件设计(管理系统)和检索系统等几个方面。
知识库硬件系统:为了最大限度地发挥知识库的作用,应该把知识库建立在设置了磁盘阵列(RAD)的海量存储设备中,以保障系统的快速、高效、正确的存取。
知识库管理系统:知识库的纠错功能,不仅要从硬件的字节级进行,还应从软件的设计方面着手考虑。比如知识库设计应使之具有自动纠错、自动查重、自动索引和高效能开发控制等功能,以减少知识库中知识的不一致性,最大程度保证知识的准确性。
检索系统:知识库中知识量非常巨大,因此必须采用高效的数据管理系统(比如TRIP全文检索、Lotus Notes文本数据系统,MS-SOL数据库系统)作为底层的存储工具,在此基础上,进行与知识库任务相关的二次开发,从而达到知识服务系统的要求。
1.4.4 知识服务系统
智能知识服务系统利用计算机网络,通过对用户问题的分析,利用方便有效的技术手段为用户提供知识服务。知识服务系统以友好的界面,完善的智能知识过滤、知识化挖掘和推理等技术,有针对性地向不同用户提供联机的知识服务。
1.4.5 知识服务反馈系统
知识服务反馈系统基于用户对服务质量的反馈信息及用户获取服务的模式等信息,对知识处理系统的算法进行动态的调整,使之更为适应用户的知识需求。常用的高速算法有智能词表的动态高速算法等。根据用户对服务质量的意见反馈,对当前知识加工处理算法进行改进,以寻求适应广大用户新的需求的技术。
1.4.6 知识管理系统
知识管理系统是知识服务系统中管理员所接触到的系统,管理员利用该系统对全部子系统进行统一的管理和调整。管理系统的设计应充分考虑整个系统管理的需要,并且尽可能实现对各子系统管理功能的方便实用。
1.5 专业队伍建设
人才是知识服务型数字图书馆建设的根本。数字资源的采集、加工、整合与开发利用,自动化、网络化、数字化服务的开展,都对专业队伍的知识和技术提出了新的要求。专业队伍素质的高低、数量的多少都在制约着知识服务数字图书馆的发展。因此,高校图书馆在数字化建设的同时,培养和造就一支既具有丰富的学科专业知识,又具有高水平的专业技能的人才队伍是最重要的。不具备这一条,建设知识服务型数字图书馆就是空谈。
2 知识服务型数字图书馆建设的原则
2.1 服务导向性原则
用户服务是高校图书馆数字化建设和发展的根基,必须以搞好服务为建馆的第一原则。建立和完善以用户为中心的服务体系是知识服务型数字图书馆义不容辞的责任。为最大限度地满足用户的需求,高校图书馆不仅要进行数字资源建设,而且要配套建设相应服务的技术、管理、服务机制,还要研究和解决这些服务系统的可靠运行、方便利用和长期维护机制。
2.2 标准化与规范性原则
图书馆数字化信息的采集、加工、整合、传播和提供利用,都是以网络为依托,因此,标准化和规范性是高校图书馆数字化建设成败的关键,应贯穿于数字化建设的始终。高校图书馆在数字资源建设、统一信息访问平台建设、网上参考咨询平台建设等数字化建设中,应该自始至终选择统一、通用的标准、协议与规范,以及可以相互兼容的硬件和软件。
2.3 开放性原则
开放性指采用开放式的体系结构、开放的标准技术规范、硬件和软件设备,组合成能够支持多种接口、多种协议,具有充足的可扩展性与良好的兼容性的开放式数字化信息服务与信息管理系统。这样才能实现全国范围内高校图书馆资源的共建与共享。
2.4 效益性原则
高效知识服务性数字图书馆要选择能够在最短时间和最经济条件下长期可靠地实现为用户保障服务的建设方式。因此,要认真地调查研究,全盘分析、计算数字化建设与数字化服务的投入和产出效益,从而确定知识服务性数字图书馆建设所选择的建设内容与建设方式的比较效益。
2.5 创新性原则
创新性原则是指:(1)通过创新系统开发计算机系统组件技术;(2)通过创新系统提供用户的组件开发技术,通过新的数学模型应用对用户进行教育与培训。因此,在知识服务型数字图书馆建设中,既要继承与发扬传统图书馆对文献信息进行有效组织与利用的理论与方法,又要充分利用计算机、网络和现代信息技术,有所发展,有所超越,有所创新。
2.6 目标性原则
目标性原则是根据广大用户的需求目标,通过数字信息的析取和重组来形成用户易于理解和使用的知识产品,并对相应的知识产品进行全面的质量评价,从而最大程度上尽可能地向广大用户提供全面、完善的解决方案。
3 知识服务型数字图书馆实现的关键技术
目前,知识服务型数字图书馆需要开发和利用的关键技术,如表1所示:
类别 实现技术
资源采集 1.自动采集技术;综合搜索引擎;元搜索引擎;主题搜索引擎
2.手工采集
知识处理 1.文种、代码的识别与转换技术;文种识别与互译;代码识别与转换
2.资源格式转换技术
3.自动分词技术
4.标引和文摘生成技术;自动标引;自动文摘生成
5.查重技术
6.分类与聚类技术;信息聚类;信息分类;信息范畴化
知识存储 1.数据库技术
2.磁盘陈列与RAID技术
知识服务 1.WWWWebServer服务技术
2.WWWWebService服务技术
3.E-MAIL推送服务技术
4.SMS服务技术
5.知识反馈与技术进化技术
可视化内容表达;可视界面
协议、规范、 DublinCore/Mctadata;XML/RDF、专业XML;DAML+OIL;SOAP(Sim-
标准 pleObjectAccessProtocol);UDDI(UniversalDescription,Discov-
eryandIntegration);WSDL(WebServicesDescriptionLanguage);Z39.50;
METS(MetadataEncodingandTransmissionStandard);OAI(OpenArchivesI-
nitiative);SCORM(SharableContentObjectReferenceModel)
智力基础 词语控制;主题词典;词语网(Wordnet);词库(Lexicon);分类表(Taxon-
工具 omy):要领体系词典(Ontology)
协同技术 网络会议;白板通信(WhiteBoarding);实时交换信息;论坛讨论;虚拟真
实;电子学习