数字图书馆的分析模型与分析理论,本文主要内容关键词为:数字图书馆论文,模型论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
自从1994年9月美国国家科学基金会等单位正式启动实施耗资2440万美元的“数字图书馆创始”(Digital Library Initiative,简称DLI,或译为“数字图书馆先导”)计划以来,数字图书馆建设热潮席卷全球。然而,虽然数字图书馆已经成为图书馆学界的一大研究热点[1-8],却至今未建立数字图书馆的基础理论,本文对此进行初步研究。
1 分析图书馆学框架下的数字图书馆理论轴心
分析图书馆学基于实践抽象出理论概念,并采用分析方法建立理论模型,试图促进图书馆学的科学化,由此提炼出的一般化图书馆学研究的轴心是“信息资源-文化知识-信息服务(简称资源-知识-服务)”[9]。
“信息资源”是对当今图书馆内收集保存的所有载体化信息的总称,既包括传统十大文献信息源,也包括发展中的数字信息资源,以及以后可能出现的新型信息资源类型,也就是说,可用“信息资源”概括过去的图书、期刊、文献和当代数字化资源,以及这些资源的未来发展。
“文化知识”中的文化除通常文化含义外,也包含特定的三层含义:文字化、文献化、人文化。文字是人类文明的重要基础之一,有文字才会出现用文字记录的信息载体;文字化的扩展是包括图像、音频、视频等的多媒体化,多媒体化是文字化的延伸。文献中承载了文化知识,文献化本身也是一种文化。所有文化通过人综合体现出现,就是人文化。人既是知识的主体,也是文化的关键。
“信息服务”,就是利用图书馆的资源和知识满足读者或用户的需求,将信息资源转化出知识价值。随着新技术的应用和社会的向前发展,图书馆的服务不仅包括对读者或用户个人的协助行为,也包含对全人类更高理想实现的促进活动。
在数字图书馆中,主要的信息资源是数字资源,文化知识的核心凝结为特色技术,信息服务的主体是网络服务。因此,数字资源-特色技术-网络服务(简称资源-技术-服务)成为数字图书馆的理论轴心。
1.1 数字资源
数字资源是指图书馆中所有数字形式的信息资源,包括经过数字化转换的文献或本来就是以数字形式出版的信息。这些数字资源是数字图书馆的“物质”基础,也是数字图书馆有别于传统图书馆的一大特征。数字资源从类型看,包括期刊、图书、工具书、视频资料、声频资料等;从文件格式(digital format)看,包括从位图形式的页面到经SGML编码的特殊文本文件,甚至CD-ROM中的信息或本地局域网中的资源,等等。能同时处理多媒体化的数字资源是数字图书馆在技术上的一个典型特征。
数字图书馆的目的是直接提供读者所需的最终信息,而不只是二次文献,但数字图书馆也需要书目数据、索引文摘等二次文献,二次文献也是数字图书馆的数字资源的一种类型。
1.2 特色技术
数字图书馆除采用通用计算机技术和网络技术外,还有自己的特色技术,这是数字图书馆有别于其他技术领域的特征。现有特色技术包括分布式资源与运行管理技术、海量信息存储与组织技术、多媒体信息标引与检索技术等。建立特色技术的国际标准是数字图书馆建设的重要内容之一。
标准的重要性不言而喻,有了全球共同遵循的TCP/IP协议,才有Internet的今天。数字图书馆技术也需要一套公认的标准,积极参与国际数字图书馆技术标准的选择和制订,对中国发展数字图书馆至关重要。
1.3 网络服务
高速数字通信网络是数字图书馆得以存在的基础。数字图书馆的对内业务组织和对外服务都是通过网络进行的,网络是数字图书馆的生命线。基于网络运行的数字图书馆只有通过网络才能提供服务,这也是数字图书馆不同于传统图书馆的一大特征。没有网络,就没有数字图书馆;网络中断,数字图书馆的服务也会随之中止。
在明确数字图书馆“数字资源-特色技术-网络服务”轴心基础上,可以将数字图书馆定义为“数字图书馆是同时具备数字资源、特色技术和网络服务三大特征的图书馆”。也就是说,拥有数字资源、具备特色技术、实行网络服务的图书馆,就是数字图书馆。上述分析定义与美国著名数字图书馆专家WilliamArms的数字图书馆定义:“数字图书馆是具有服务功能的整理过的信息收藏,其中信息以数字化格式存储并可通过网络存取。该定义的关键在于信息是整理过的。”(A managed collection of information,with associated services,where the information is stored in digital formats and accessible over a network.A crucial part of this definition is that the information is managed.)是兼容的。Arms的定义将数字图书馆界定为一种信息收藏,兼顾了数字资源和网络服务,也蕴涵了需要技术支持。
2 数字图书馆的分析模型
围绕数字资源-特色技术-网络服务轴心,可以构建数字图书馆的形象模型和抽象模型,从而获得数字图书馆的分析模型。
2.1 形象模型
与数字资源、特色技术和网络服务相应,数字图书馆的理论构架可以用一个形象模型表达,如图1所示:
附图
图1 数字图书馆的形象模型
资源是数字图书馆赖以存在的基础,技术是数字图书馆得以成立的条件,服务是数字图书馆努力追求的目标,这是一个以资源为核心、技术为支撑、服务为目的的数字图书馆形象模型,有关数字图书馆的理论可以由此展开[10]。
根据这一理论模型,在数字图书馆研究中,必然会形成三大学派:
(1)资源主导学派:强调数字资源最重要,认为资源在数字图书馆中居于核心地位,并据此主张建立资源主导型数字图书馆。
(2)技术主导学派:强调特色技术最重要,认为技术在数字图书馆中居于核心地位,并据此认为在数字图书馆建设中应以技术主导,导致技术主导型数字图书馆。
(3)服务主导学派:强调网络服务最重要,认为服务在数字图书馆中居于核心地位,并据此倡导建立服务主导型数字图书馆。
而正确的认识应是资源-技术-服务的综合集成和一体化——没有资源,数字图书馆就失去存在基础;没有服务,数字图书馆就失去存在价值;没有技术,数字图书馆难以运行。资源、技术与服务相辅相存,构成数字图书馆的“三位一体”。
2.2 抽象模型
按照资源-技术-服务一体化思想,将形象模型抽象化,可以得到如图2所示的数字图书馆抽象模型:
附图
图2 数字图书馆的抽象模型
这一抽象模型是对资源-技术-服务一体化数字图书馆系统的简单抽象:数字图书馆的硬件边界由技术“范围”而成,数字图书馆的结构抽象化为技术,资源则抽象化为数字图书馆系统的输入,而服务抽象化为数字图书馆的输出。
2.3 数学模型
基于一般信息系统模型和上述抽象模型,在分析信息学框架下[11],可以进一步建立数字图书馆的数学模型如下:
附图
图3 数字图书馆的数学模型
在该模型中,I是信息供应量、J是信息获取量、B是反馈信息集、S是技术系统结构,资源、技术和服务分别对应一般信息系统的信源、信道和信宿。
从数学关系分析,J实际上可看作是初始信息量I经过S变换后产生出的有效信息量,故整个模型类似于一个数学变换体系,需要寻求的数学关系相当于
F(J,B)=f[G(I,S)]
函数F表征服务(信宿)特性,函数G表征资源和技术系统(信源和信道)特性,二者之间的函数关系就是数字图书馆的一种数学模型。其中S是决定系统性能的核心参量,而B则代表了用户主动和交互。
3 数字图书馆的分析理论
既然数字资源、特色技术和网络服务是数字图书馆的理论轴心,则数字图书馆的理论框架可由数字资源、网络服务和支持技术构成。
在上述一个轴心基础上,数字图书馆研究的理论原则自然推衍为:
第一原则:数字资源是基础。该原则奠定数字图书馆的物质基础。
第二原则:特色技术是关键。该原则指明技术在数字图书馆中的功用。
第三原则:网络服务是目的。该原则阐明数字图书馆的应用目标。
这样,“数字资源是基础”、“特色技术是关键”、“网络服务是目的”三原则相结合,构成数字图书馆学研究的理论基础,也是分析图书馆学理论原则的一个子集。
3.1 数字资源是基础
作为数字图书馆基础的数字资源有两大来源:
(1)印刷资源的数字化
对于版权已过期的图书、文献、资料,可以采用扫描、光学字符识别(OCR)等处理技术进行数字化,形成数字资源的基础部分,这类资源以经典著作和古代文献为主。
(2)原生数字资源
除将已有的文献信息资源数字化外,现在原生数字信息资源已经越来越多,尤其是学位论文、技术报告、会议录等。而且,现在出版业已经实现数字技术处理,图书、期刊的出版都是先有数字化版本,再生成印刷本,因此,作为信息资源主体的传统图书、期刊正在被数字图书、数字期刊所覆盖,原生数字资源正逐步成为数字资源的主体。
3.2 特色技术是关键
除计算机技术、网络技术和信息安全技术等通用信息技术外,建设数字图书馆所需的专用创新技术涉及数字信息处理与加工技术、海量信息存储与组织技术、分布式资源与运行管理技术、多媒体信息标引与检索技术、信息挖掘技术、个性化信息定制与发布技术、信息可视化与读者界面技术、信息安全技术、数字权益管理技术等。其中数字信息处理与加工技术、海量信息存储组织技术、多媒体信息标引与检索技术、分布式资源与运行管理技术、个性化信息定制与发布技术等对于数字图书馆都非常重要。
技术不仅是数字图书馆的重要支柱,而且是联系资源与服务的纽带。在数字图书馆的资源处理和网络服务等方面,都不能缺少技术支持。
3.3 网络服务是目的
数字图书馆通过网络实现服务,其网络服务模式可以分成被动服务和主动服务两类:
(1)被动服务
既然社会为建设数字图书馆投入了大量人力、物力和财力,那么不管是否情愿,数字图书馆就责无旁贷地要提供服务,这就是非常被动的“不得已”被动服务,不过,被动服务也是数字图书馆网络服务的基础方式,其特点是不考虑用户的个别要求,具体实现形式一般是采用无交互Web网站模式。
无交互Web网站作为数字图书馆被动服务的主流模式,是一种单向信息传递模式。在这样的模式中,数字图书馆将数字资源以网页形式和数据库形式“放置”在网络上,用户自己“取用”,数字图书馆除在网页上提供使用指南信息外,不再提高附加服务,服务形式对所有用户千篇一律,系统处于主动地位,用户处于被动地位,信息从资源到用户单向流动。显然,这是最初级的网络服务模式。
改善被动服务的技术方法是通过纯粹Email或Web表单方式提供用户附加信息资源或解答用户提问,这是最简单的被动服务改良模式,但可以为用户提供便捷、经济的通讯渠道。
(2)主动服务
主动服务是数字图书馆网络服务的高级方式,特点是考虑用户的个别要求,具体实现形式一般是通过交互式Web网站形式。
交互式Web网站形式具体可分为双向交互问答模式和个性化信息推送模式,在技术上前者可以通过Chat形式实现,后者可用MyLibrary形式实现。
从单向信息传递模式到个性化信息推送模式,一方面体现了技术的进步,另一方面也越来越多地将控制权和主动权交给用户,用户技术水平和应用水平越高,使用效果就越好,同时,资源管理方也应重视对数字资源的整合和对操作方法的优化,使数字图书馆的网络服务具有保障。
4 数字图书馆的动力机理探讨
下面从理论上对数字图书馆的动力机理略作探讨。
4.1 运行动力
探讨数字图书馆的动力机理是数字图书馆理论研究的核心问题之一。根据上述数字图书馆的理论模型,如果将数字图书馆的构成简略分解为资源、技术、服务三部分,则可以用图4简要分析其运行动力:
附图
图4 数字图书馆运行动力示意
其中,站在服务角度看,服务的需要拉动了资源建设,技术的发展推动了服务;站在技术角度看,技术进步能拉动服务,资源建设的需要能推动技术;站在资源角度看,资源数字化建设的需要会拉动技术发展,服务的需求又会推动资源建设。
4.2 学术动力
从学术研究角度分析,任何学术研究总是要不断发展,因而存在学术动力。当前,数字图书馆研究正由计算机技术专家和图书情报专家共同推进,形成如图5所示的学术动力结构:
附图
图5 数字图书馆的学术动力示意
也就是说,随着计算机技术水平和图书情报学术水平的不断提高,数字图书馆学术水平也会不断提高。
在对数字图书馆特征要素的关注方面,计算机技术专家可能更多地偏向于技术主导,而图书情报专家可能更多倾向于资源主导和服务主导,但无论是设计技术主导型数字图书馆,还是设计资源主导型、服务主导型数字图书馆,目标都是一致的,就是要方便用户使用、要提高数字图书馆的应用效益和学术水平。
数字图书馆理论研究是数字图书馆建设中极其重要的一环,值得重视。通过理论模型,可以进行定量分析,并能发现动力机理,这对数字图书馆建设将具有重要指导意义和参考价值。
5 小结
综上所述,在数字图书馆中,信息资源就是数字资源,文化知识的核心是特色技术,信息服务的主体是网络服务,由此可以构建围绕数字资源-特色技术-网络服务轴心形成的数字图书馆的分析模型和分析理论。建立在数字资源基础上、靠技术支持运行、通过网络提供服务的数字图书馆,具有丰富的研究内容和广阔的发展前景。数字图书馆与传统图书馆相互结合构成的复合图书馆(Hybrid Library)理[12]也可围绕信息资源-文化知识-信息服务轴心构建。