数字图书馆的成本分析_数字图书馆论文

数字图书馆的成本分析,本文主要内容关键词为:数字图书馆论文,成本论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2008)06-0109-05

1

1.1 数字图书馆成本分析的意义

首先,开展数字图书馆项目之前有必要进行成本分析。我们在启动任何一个项目之前都应对它的成本收益有一个初步的了解。成本包括哪些内容,初始投资和以后的持续性投资之间的关系怎样,收益如何,是否可以达到预期的效果等问题,都是一开始就应考虑的。毕竟数字图书馆是一项投资规模浩大的工程,需要考虑到各成本要素之间的相互协调,以及近期投入与远期投入之间的相辅相成,以降低数字图书馆的隐性成本,这对于数字图书馆的可持续发展是有必要的。第二,数字图书馆的企业化运营,也有对数字图书馆进行成本分析的要求。数字图书馆的发展面临着技术,资金,管理,服务,知识产权等一系列问题,文献[1]介绍了数字图书馆的企业化运营模式[1]。既然是企业化模式,就有必要对数字图书馆进行成本分析。

1.2 国内外研究情况

1994年,Nair对印度玛阿哈加女子学院(Maharaja's college for Girls)的图书馆自动化做了成本效益分析[2],通过手工与自动化的对比,他认为在图书馆的运转和提供服务中使用计算机可以节约成本、提高效率。Lowry和Troll给出了获取和维护数字文件与纸质文件的费用比的估算方法[3]。

Kingma[4]对Early Canadiana Online(ECO)数字图书馆工程的效益检验,ECO由非赢利性组织Canadiana完成并维护,旨在对加拿大的早期出版物进行数字保存,出版物的时间跨度是从加拿大的欧洲移民时期一直到20世纪初。Byrd在对馆藏资料数字化工程进行成本收益分析中,利用3种读者类型提出了比较模型[5]。Scigliano则对电子资源的集团采购成本与收益进行了详细分析,计算出与单独采购相比,团体购买可以节省20%到70%的采购成本[6]。Montgomery和King则对电子期刊与传统纸质期刊在场地、设备、人员工资以及服务提供等方面进行了比较[7]。Chapman则以哈佛大学图书馆和OCLC数字档案馆为例对数字保存费用进行了透彻的分析[8]。Palm强调了软硬件的维护与更新成本对于数字图书馆的重要性,以及说明了从长期来看,维护成本的增加将会是数字图书馆总成本上升的主要因素,并且维护成本占总成本的份额也会越来越大[9]。

国内的研究包括,探讨了信息资源的成本,数字图书馆的经济及社会效益和数字图书馆的可持续发展三者之间的关系[10]。运用经济学的基本概念来诠释数字图书馆[11-12],对标准化及非标准化两种情形下的成本收益进行了对比分析[13]。论述了与传统图书馆相比,数字图书馆具有成本优势[14]。说明了对数字图书馆进行成本分析的必要性,并从会计角度分析了数字图书馆的成本构成[15]。通过传统馆藏与数字馆藏的对比,揭示了构成数字馆藏成本的各个因素,并对数字馆藏的管理成本进行了探讨[16]。通过对迁移法和仿真法进行成本的对比分析,提出要根据数字资源保存的数量和保存时间来制定长期保存策略[17]。

本文按照数字图书馆的构成,包括对数字图书馆的管理、数字资源的建设、数字资源的保存、数字资源的服务以及人力资源来分析数字图书馆的成本。

2 数字图书馆的管理成本

对数字图书馆的管理强调的是数字图书馆的技术内容和管理相匹配的问题。随着数字图书馆的发展,对于数字图书馆的管理也要相应地发展,而管理有与之相对应的管理成本。

对数字图书馆所采取的管理要与数字图书馆的技术内容搭配起来,用管理成本的概念来说,就是要针对特定的管理对象,采取适合的管理方式方法,使得相应的管理成本为最优。也就是说,数字图书馆的管理成本最优意味着对数字图书馆的管理和技术内容相匹配。管理成本最大或是最小都不是我们所追求的,我们追求的是和数字图书馆的发展相匹配的管理,以及所带来的相匹配的管理成本,这样才能更好地促进数字图书馆的发展。相互匹配在时间尺度上,要考虑短期的相互匹配和长期的匹配之间的关系。第一,数字图书馆一定会随着技术、用户、标准化等因素的发展而发展,所以相匹配的管理系统以及管理成本都不是静态的,一成不变的,要随着数字图书馆的变化做出相应的调整。第二,短期的管理体系及成本要着眼于长期管理成本,往往是为了长期管理成本的最优要舍弃近期管理成本的最优,要考察长期管理和短期管理的关系,短期管理要为长期管理的最优做准备,长期管理的最优对短期管理及其成本做指导,利用短期管理和长期管理之间的关系,分析短期管理及成本对长期管理成本造成的影响,然后形成长期管理对短期管理的反馈,以对短期管理及其成本进行调节,以确保长期管理成本最优。另外,局部的最优并不一定是整体的最优。数字图书馆技术内容所涉及的领域要比传统图书馆宽广,而且发展具有阶段性,比如中文资源的自动录入、数据的存储与压缩、数字化资源的分类和检索、系统的安全性及开放性、标准化问题、非文本数据的可视化等等,各个领域之间相互联系,在发展上也存在相互协调问题,工序上也有时间先后问题,而就是因为技术内容所涉及的问题相互关联,所以数字图书馆的技术内容与管理的局部匹配并不代表着整体管理成本的最优,从系统的观点看,这是大管理与小管理之间的协调问题,相应地也产生了大管理成本和小管理成本之间的协调问题。更何况管理活动本身包含的内容众多,管理的过程本身也具有阶段性和层次性,所以为了实现整体管理成本的最优,还要涉及到局部管理与整体管理之间的关系。

关于管理成本的分类,如果按照管理对象的不同,可以把数字图书馆的管理成本划分为知识管理成本、用户管理成本、人力资源管理成本、网络信息资源管理成本、数字图书馆的战略及标准化管理成本6个方面。如果按照管理活动来进行分类,管理成本则体现在管理的计划、组织、指挥、协调和控制的过程之中,同时管理各要素也应有各自的成本。

3 数字资源建设成本

数字资源是数字图书馆的重要组成部分,这方面的费用支出在整个数字图书馆的成本中占很大比例。数字资源建设成本主要包括3方面的内容,即数字化成本,数字资源采购成本以及数字资源的加工处理成本。

3.1 数字化成本

针对图书馆资源的数字化,是指将馆藏资源从印刷形式转变为数字形式,然后通过网络向用户传播。如弗吉尼亚殖民记录项目(Virginia Colonial Records Project)花费了11766美元用于扫描28194幅调研报告的图像,并把图像链接到书目记录以及所有的图像增强和图像工程整合的任务[18]。

2005年在瑞典国家档案馆的媒介转换中心(MKC)大约有80名职工。如果扫描模式取1-bit单色/600dpi/A4/自动,且年扫描图片量为500万张,那么图片扫描的成本为每个扫描文件0.1欧元。费用分布如图1所示[9]。在这个过程中,成本的1/3是用于扫描工序,而前期准备、质量的控制、额外和临时的支出以及行政管理等4个部分的费用大致相等。

图1 瑞典国家档案馆的扫描机构MKC的费用分布(1bit,600dpi,A4格式)

如果扫描模式取8-bit灰阶/279dpi/A2/手动,且年生成图形文件1321000个,那么大像幅绘画及地图的扫描成本为每个扫描文件0.61欧元。这时的费用分布如图2所示[9]。其中扫描工序的成本在资源数字化总成本中的份额几乎增加了1倍(65%),管理列在第二位,其余部分的费用份额基本上一样。

图2 瑞典国家档案馆的扫描机构MKC的费用分布(8bit,297dpi,A2格式)

当数字化音频及视频馆藏时,还需要考虑时间成本。例如瑞典国家音像档案馆(SLBA)在2004年对其馆藏的数字化,在保证转换质量的前提下,SLBA根据磁带及录像带格式的不同采取相应的数字化策略以节省时间、提高数字化效率。即便这样,考虑到其400多万小时的音视频资料,这么巨大的馆藏量,估计整个数字化过程需要10年的时间才能完成。另外,音视频馆藏数字化导致的结果往往是庞大的数字信息需要存储和长期保存。比如,SLBA如果将其馆藏磁带和录像带分别转换为CD格式与DVD格式的话,所得数字资源占用的空间将达到8个PB,这涉及到数字资源的保存成本。同时,采用不同的压缩技术,压缩效率会大不一样,因此所节省的时间成本亦不同,当然这是以保证数字转换的质量要求为前提的;而通过不同的压缩技术得到的数字资源的格式以及占用空间也不同,所以相应的保存成本也不同。所以数字化过程直接影响到数字资源的保存成本。

3.2 数字资源采购成本

除了数字化自身馆藏外,图书馆还可以购买电子期刊,电子图书等电子出版物作为其数字资源。一般来说,采购电子期刊或是订购数据库比订阅传统的印刷版期刊要节省不少的成本[7]。但是在数字资源在采购前还是要做用户的需求分析。特别是在资金有限的情况下,如何将有限的资金最大程度地满足用户的需求,这实际上是一个统筹优化的问题。这样做可以降低数字资源的采购成本,原因是减少了机会成本,使得资金的利用达到最优。

3.3 数字资源的加工处理成本

在获得数字化的资源之后,还需要对数字资源进行加工处理,为面向用户提供应用服务做准备,数字资源加工处理的主要内容包括创建元数据规范、内容索引和自动分类等。如弗吉尼亚殖民记录项目花费53408美元用于为14704份调研报告建立MARC书目记录、定制数据库等[18]。

Puglia估算出在图像数字化过程中,有29%的费用是用来创建元数据的,包括编目、描述和索引,几乎与数字转化的费用(占32%)相当,还有39%的成本用于其它工序,包括质量控制,图像维护等[19]。在美国档案记录管理局的电子获取项目(NARA-EAP)中,平均每幅图像的数字转化费用为7.60美元,元数据创建的估算费用也达到了7.60美元,再加上其余工序费用,平均每幅图像数字化的总估算成本为12.60美元至17.60美元,效率为200幅/天。因此,数字资源的加工处理成本不容小觑。

4 数字资源的保存成本

数字资源的保存成本主要包括2方面:一是数字资源存储体的成本;二是数字资源的长期保存成本。

4.1 数字资源存储介质的成本

数字资源不同于传统的纸质文献,“它必须存储在特殊的介质中,变得只能通过特定的技术获取,这就构成了持续的成本因素”[9,21]。OCLC的费用是1GB至100GB的数据,每GB每年60美元;101GB至1000GB的数据,每GB每年32美元;大于1000GB的数据,每GB每年15美元[8]。表1给出了OCLC数字档案馆的年存储费用。

表1 OCLC的年存储费用(按格式分类)

*这里的15美元/GB是假定已有存储量已经达到1000GB,如果是首次存储,则在101GB至1000GB时为32美元/GB,在不到100GB时为60美元/GB。

另外,虽然存储介质的性价比在不断提高,导致占数字图书馆总成本的份额呈下降趋势,但是当存储成本下降到一定程度时,计算机系统要处理的数据量以及系统的复杂度会随之上升,这会带来存储介质维护成本的增加。

4.2 数字资源的长期保存成本

数字资源储存在只能通过技术才能回取的环境中,所以一个重要的问题就是要保证数字资源与回取技术的相互匹配。在数字资源的建设过程中,扫描、压缩以及元数据规范等技术在理论和具体实现上都在不断的发展,而且变迁升级的速度很快,这就导致了已有数字资源在存取上的老化问题,也就是说,如果新的存取技术向下不兼容或者兼容性差的话,原有资源就可能无法顺利地读出。即便旧的存取技术还未遭淘汰,由于其规模效应逐渐消失,旧技术的使用及维护成本也会日益增加;另外还会产生附加成本,比如(1)旧存取技术的采用会因为其它数字技术的发展而给数字资源的整合带来压力,(2)因为一般来说新技术总是要比旧技术更具有优势,所以还要计入不采用新存取技术而带来的机会成本。因此总的来说,存取技术的更新换代是必要的,那么原数字资源与现存取技术之间的匹配问题就不得不考虑了。另外还要考虑数据的丢失以及文件的损坏等因素,这些都是在数字资源长期保存的成本分析中要考虑的内容。

我们目前处于这样一个局面,为了不损失对原数字资源的投入,就必须再追加投入,以供对原数字资源的长期保存方法之研究、选择以及实施之用,这构成了数字资源长期保存成本的重要组成部分。否则,就会如同Palm指出的那样,由于原数字资源的无法顺利回取,而可能造成对原数字资源投入的巨大浪费[9]。究其原因,归根结底是由目前数字资源的静态性与回取技术的动态性之间的矛盾造成的。当然和数字资源的高投入性也是分不开的,否则可以按照与新的回取技术相匹配的原则来重新建设数字资源。另外需要指出的是,这种再投入还是持续性的,因为原数字资源面对的是始终在不断发展的技术格局。

数字资源的长期保存方法目前又大体分为两种:一是迁移法;二是仿真法。迁移法是要对数字资源进行格式转换,以供新的软硬件技术访问。仿真法不改变资源格式,而是要创建新软硬件技术访问原格式数字资源的环境。采用迁移法和仿真法来保存数字资源的费用以及两种方法在费用上的差别不仅和要保存的数字资源的规模有关,还和要保存的数字资源的类型有关,也和数字资源的保存时间长短,甚至和数字技术的发展,人力资源水平的提高都有关系。因此在数字资源的保存实践中,应该做好对要长期保存的数字资源自身性质的分析,也要做好对保存的技术环境、人力环境的分析,还要做好对保存时间长短的因素分析,而这和信息资源的老化,信息生命周期等理论有密切的联系。分析的目的之一就是为了采用与数字资源相匹配的保存方法,来实现保存成本的最优。相匹配的保存方法不会是迁移法和仿真法的各自孤立使用,而是两者的相互交融,相辅相成,在保存过程中的各个阶段都会有交叉。所以从这个角度来说,数字资源的长期保存以及保存成本的研究是一项系统工程,不仅要考虑到保存对象和保存环境,还要考虑到两者之间的相互作用。

还有一方面需要引起注意。随着数字资源量的持续增加,对数字保存的压力会越来越大,因此还需要采用数据压缩技术来进行缓解。压缩技术分为通用数据压缩和多媒体数据压缩。后者主要针对图像以及音频视频进行压缩,通过表1可以得知这种压缩技术对于数字图书馆尤为重要。数据压缩也是有成本的。首先,数据压缩的基本思想在于信息是有冗余的,根据信息论,要先建立数学模型构造出完备的概率空间,然后在此基础上进行编码来降低这种冗余。所以针对不同的对象,数学模型和编码方法会不同。而不同的压缩方法有不同的压缩成本,比如耗费的时间成本会不同,对硬件的要求也不一样。其次,对于音频视频等大数据量的压缩对象,提高压缩效率的方法是牺牲压缩精度,所以多媒体压缩又可分成有损压缩和无损压缩,而精度的降低带来的是数字图书馆服务竞争力的潜在下降,这种代价是战略性的。第三,压缩理论和技术还在不断的发展,特别是针对数字图书馆的数据压缩还没有专门的标准,这在数字资源的整合过程中会带来附加的成本。

5 数字资源的服务成本

数字资源的服务主要体现在数字资源的整合、发布、检索、内容提供以及用户管理等。服务成本主要涉及到与服务内容相关的软硬件购置。硬件主要包括计算机设备以及网络设备等。软件需实现用户界面、检索、可视化、专用工具的设计与集成、内容服务、安全性、开放性等功能。实际上,数字图书馆的整体技术架构都需要相关软件的支持。另外,如果图书馆自行开发软件,还要计入开发成本,包括需求分析成本,系统分析成本,代码开发成本,软件测试成本,相关软硬件的购置成本。

同时还要考虑到上述软硬件的维护和更新成本。由于微电子技术的迅速发展,用户需求的增加,行业之间的竞争等因素,服务器、交换机等设备的硬件可靠性每年都会增长。虽然硬件的价格性能比呈下降趋势,但数字图书馆对于硬件的维护成本仍然不可小视。这是因为服务器等设备的更新速度很快,维护旧设备的费用甚至比购买新设备的费用还要高,一旦设备步入换代期,设备规模效应的消失就会使维护成本大大增加。

新设备往往比老设备在可靠性上更好,维护费用会更少,所以在老设备的维护成本中如果再计入机会成本的话,所得数值会更高。除此之外,还必须面对由于电源不正常、操作失误、病毒等所造成的硬件基础设施的日常维护。更何况,基础设施的维护还需要专门的技术人员来操作,所以人员的费用也要考虑进来。

另外,为了提高数字图书馆的服务质量,面对数字图书馆访问量的日益增加,也确实需要对硬件设备及时进行更新。美国国会图书馆战略规划副馆长Campbell试图在高峰时期来检验美国国家数字图书馆的系统性能,她“曾3次试图进入图书馆网站,但每次得到的回应都是暂时无法进入”。信息技术服务部主任Becker说:“从去年夏天开始,我们一直在提升RS6000服务器的性能,以应付不断增加的访问图书馆所提供的网络资源的需求。迄今为止,图书馆3/5的服务器已经从1个处理器升级到8个处理器,存储容量也升至以前的4倍之多”[20]。

还应该考虑到软件的维护成本。软件维护包括纠错维护和适应维护。一般来说,软硬件可靠性越高,纠错越难,尤其是发现潜在的错误也越难,从而相应的纠错维护成本也就越高,而且会随着软硬件技术可靠性的提升会变得更高。当然,软硬件可靠性越高,出错的可能性也会越小。同样地,系统的规模越大,系统兼容性越差,要使系统适应软硬件的更新换代也就越难,相应的适应维护成本也就越高。因此数字图书馆功能软件的开放性很重要,因为开放性不仅有利于集成各类数字资源,而且还能有效地降低软件的适应维护成本。

6 人力资源成本

数字图书馆对人力资源的要求比传统图书馆的要求高,馆员的数字技能直接影响着数字图书馆的发展。总体来说,人力资源成本的增加不仅体现在对图书馆员的继续教育,还体现在掌握现代信息技术的员工的工资及福利也会比传统图书馆员要高。根据Montgomery和King在2002年的调查显示,如果将德雷塞尔大学图书馆的员工年成本按照电子期刊与印刷版期刊来进行分摊,那么电子期刊的员工年成本要比印刷版期刊的员工年成本高,分别为125000美元和88000美元[7]。

实际上,人力资源成本渗透于上述数字图书馆的各个组成部分。除了对数字图书馆的管理,数字资源的建设也需要掌握现代信息技术的人员,对于数字资源的长期保存也离不开他们。1998年图灵奖获得者、微软研究员Gray认为“the real cost of storage is management”,互联网档案组织(Internet Archive)和Google是平均每100个TB有1位数据管理人员。对于数字资源的服务,Puglia认为,在软硬件的维护和更新成本中,所占比重最大的就是劳动力,所以即使数字存储体的费用持续下降,维护费用还是会持续增加,而且增加的速度要比存储体的费用下降速度快[19];另外,数字图书馆的用户需要的是一个始终运转,并且永远不会出错的系统呈现在他们面前,这就要求系统后台的高水平维护与更新,而这是高成本的。Gray希望实现系统自动对其软硬件进行维护与管理,包括自修复以保证无故障运转,还有数据无丢失等,但是从目前看来,这还属于一项长期研究,潜在的人力资源投资还无法估量。更何况,存储量的增加往往伴随着系统复杂度的提高,这对数字图书馆的相关软件设计也是一个挑战,而在软件开发方面人力资源的成本份额更高[9]。

7 结语

因为数字图书馆的各个构成部分相互联系,所以本文采用系统的观点来分析其成本。因为数字图书馆的投入不仅仅是一次性的,而是需要持续性投入才可以充分发挥其作用,所以还采用了发展的观点来看待数字图书馆的成本。我们希望在成本分析的基础上,建立对数字图书馆成本的评价指标体系,以对数字图书馆的成本进行评估。文中对数字图书馆成本的一级指标的确定和分析还属定性,仅部分给出了数字说明。因为量化可以使问题的分析更加精确,所以定量分析同样很重要,包括原始数据的获取以及模型的建立等等。但是在数字图书馆的成本构成中有很多因素,比如管理成本以及各部分成本之间的关系等,难以量化,或者说还没有很合适的定量方法,所以目前定性与定量相结合的综合分析方法值得考虑。数字图书馆成本分析的最终目的是为了数字图书馆的成本最优化以及数字图书馆的可持续发展。

收稿日期:2008-02-25

标签:;  ;  ;  ;  

数字图书馆的成本分析_数字图书馆论文
下载Doc文档

猜你喜欢