云计算给图书馆管理带来挑战,本文主要内容关键词为:图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言
云计算(Cloud Computing)概念走强是2008年计算机领域最令人振奋的事件之一。据皮尤互联网和美国生活项目公布的一项调查显示,虽然许多用户可能不熟悉这个词,但69%的用户已经在利用云计算[1]。可见云计算已经不只是大型网络企业的炒作,而是一种实实在在的服务模式了。
从图书馆自动化发展史看,几乎每一项新信息技术的出现,都能引起图书馆界的极大关注并推动图书馆的管理与服务升级。由于新兴的云计算服务可望从基础设施层面解决许多长期困扰图书馆网络信息管理和服务中存在的问题,可以预料,会有越来越多的图书馆试水云计算,通过云计算来提升图书馆网络信息管理与服务的水平,降低管理与服务的成本。
正如当年数字图书馆技术出现后,图书馆界出现很多质疑声音一样,云计算在图书馆应用的设想或尝试也将遇到质疑。但这并不妨碍我们启动与规划对于云计算应用的研究。面对迅猛而来的云计算,图书馆界一方面需要研究云计算与图书馆的关系、云计算在图书馆的应用前景等基础性问题,另一方面,也是更为紧迫的理论问题是,面对云计算应用可能导致的图书馆管理的挑战,我们有没有足够的理论资源,为国家、行业或图书馆的管理者提供必要的政策思想、管理规则和解决方案?
从云计算的基本理念及图书馆应用云计算的可能框架分析,云计算给图书馆管理所带来的挑战是前所未有的。如果图书馆管理者(包括行业管理者和单个图书馆的管理者)有能力驾驭云计算这种先进的网络服务模式,将为图书馆带来巨大的利益。但是,图书馆应用云计算并没有现成的道路可走,前方的道路可能比以前图书馆自动化、数字图书馆的进程存在更大风险。这就需要图书馆界迅速应对云计算给图书馆管理提出的挑战,对应用云计算所导致的管理问题进行系统、深入的研究。
2 云计算与图书馆
云计算概念出现的时间并不长,但由于云计算技术的产生背景和推动力量非常复杂,研究者背景与视野不一,因此云计算的概念多且杂乱。Matrix曾总结了云计算的20个定义[2],但仍远远不能涵盖已有定义。惠普公司副总裁Andy Isherwood更加直接地说:“很多人在投身云的潮流,但我没有听到两个人说同样的事情”。概念混乱是图书馆人质疑云计算研究的理由之一。对图书馆人而言,应该适当与云计算概念的讨论保持一定距离,而将理论关注的重心放在云计算的应用上。
图书馆界应用信息技术一贯不甘落后,2008年中,OCLC的Janifer Gatenby在期刊上撰文指出:“对图书馆而言,重要的是拥有与控制他们的数据资源,自由地共享、提供访问、曝光数据,而拥有或运行操作与管理这些数据的软件则不那么重要。”[3]这是OCLC规划云计算应用的征兆。2009年初,Michael Stephens预测图书馆界2009技术趋势,将云计算列为十大技术趋势之首[4];刘炜在总结2008年图书情报领域十大技术进展时,也列入了云计算[5]。
其实在云计算概念出现之前,已经有不少与云计算相关的网络技术或服务应用到了图书馆,包括:
书目数据库或全文数据库商很多年前就以网络数据库取代了光盘版,早期的镜像版也越来越多地被网络版所取代,实际上是将图书馆接入了数据库云。
软件提供商不断尝试改变软件提供模式,通过提供IT服务取代简单地销售软件产品。比如图书馆自动化管理系统(ILS)托管平台,在厂商的服务器上安装管理软件、由厂商负责维护,图书馆通过网络浏览器实现业务的自动化管理。以前这种软件即服务的产品主要面向中小型图书馆,或者只限于图书馆的某些辅助应用,如WebFeat Express就提供托管型的跨库检索系统。
2005年起迅速发展的Web2.0技术在图书馆的应用,更是包含大量云计算成分,例如在图书馆服务中采用Conduit在线服务生成的浏览器工具条、利用即时通讯工具QQ、MSN及Meebo、“晒网”等在线服务提供实时参考咨询等,均为基于云的服务。
2009年4月23日,世界最大联机图书馆服务供应商OCLC宣布即将推出基于WorldCat书目数据的“Web级协作型图书馆管理服务”[6],被公认为是一项云计算服务,其目标是取代各类型图书馆的集成管理系统。由于OCLC在图书馆界的广泛影响,此举预示着云计算在图书馆领域广泛应用的开始。
由于云计算与图书馆IT关系密切,2008年10月,Jason Griffey在《图书馆杂志》旗下的netConnect杂志发文提出“云图书馆员”(Cloud Librarians)的新概念。他认为,“图书馆建筑物不会消失,我们仍将有许多资料需要照料。建筑物将越来越具有当前的双重性质,即仓库与聚会场所,而我们的服务与内容将存在于云中,远离任何物理场所”[7],也就是说,云计算的到来将使图书馆员依托云而非实体图书馆提供服务,成为“云图书馆员”。2009年5月,英国的图书馆自动化系统供应商Talis公司的Richard Wallis、Google的Frances Haugen和图书馆自动化领域专家Marshall Breeding对谈云计算对图书馆的影响[8],提出了“云计算图书馆”(Cloud Computing Libraries)的新概念,表明Talis试图找到一个能够聚合云计算在图书馆应用的新术语。
对云计算的分类方法有很多,包括Jaeger等人将云分为云基础设施(cloud infrastructure),或者基础设施即服务;云平台(cloud platform),或者平台即服务;云应用(cloud application)[9]。Sun微系统公司基本采用了这一分类方法,即:软件即服务(SaaS)、平台即服务(PaaS)、基础设施即服务(IaaS)[10]。这一分类强调了基础设施即服务在云计算中的重要价值,将它与平台即服务、软件即服务区别开来,对研究云计算与图书馆的管理问题更有帮助。
若以上述分类的角度看云计算在图书馆的应用,可以看到目前主要还是平台层面与软件层面的应用。实际上,给图书馆带来最大挑战的云计算问题来自基础设施层面。Nicholas Carr最早将云计算导致的IT模式变化与供电基础设施相比较:“今天,我们正处在另一个新纪元巨变中,一个世纪前发生在发电上的一切正发生在信息处理上。由个别公司建造与运行的私有计算机系统,正经由公共网格即互联网、被中心化的数据处理厂所提供的服务排挤掉。计算变成了公用事业……如同电力公用事业,新的计算公用事业正达到远超过大多数公司以自己系统所能达到的规模经济。”[11]将云计算与水电供应相比,的确可以帮助我们更好地了解云计算的意义与价值。在一个电力基础设施发达的社会中,普通企业靠自备发电机供电是不可想象的。在云计算成为基础设施后,图书馆也许可以将自己的软硬件全部“外包”给某一片“云”,像用电一样,按时付费。可以想象,一旦这种模式成立,它将给图书馆IT管理带来多么大的变化:
◆不再需要购买多种服务器、大容量存储设备,可按需使用云计算,按使用付费;
◆也不需要那么多远离服务一线的IT维护人员,不再为留不住优秀的IT人员发愁;
◆不受自动化系统供应商的制约,可随时转移到服务与价格更好的系统。
然而,与云计算带来的巨大好处相比,云计算带来的管理挑战也是现实的。这种挑战是图书馆管理在应用云计算时所必须面对的。
3 云计算导致的图书馆管理挑战
经过最近一、二年的实践与讨论,云计算的技术轮廓与应用领域已经渐渐清晰。但是,云计算将给图书馆的管理和信息服务带来什么变化,或者说图书馆一旦将自己的IT交付于云,它的管理与服务将有什么变化,应该说还存在相当大的不确定性。实际上,处于迅速发展中的云计算受到许多专家的强烈质疑。最为典型的是加特纳公司所指出的云计算7大风险,即优先访问权风险、管理权限风险、数据处所风险、数据隔离风险、数据恢复风险、调查支持风险、长期发展风险[12]。更为积极的云计算研究则希望通过制定相应的国家或行业政策、管理制度、规则,消除云计算应用所面临的不确定性或风险。例如,《云计算权利宣言》一口气提出了云计算用户应有的“审计、账单、备份、数据、接口、法律、位置、安全、服务、标准”10项权利要求[13]。加州大学伯克利分校Armbrust等人的技术报告《云之上:云计算的伯克利评论》,讨论了云计算的10大障碍,涉及服务、数据、信誉、知识产权等问题[14]。马里兰大学的Jaeger等人讨论了云计算的“获取、可靠性、安全性、数据保密和隐私、知识产权、数据的所有权、互换性、审计”等8个方面的“规则”[9]。所有这些研究,均涉及云计算的宏观管理问题。
在BBC、《经济学家》等重要媒体上出现的云计算文章,更是关注云计算的管理问题。如2008年10月,《经济学家》发文评述云计算问题,其中一段被人们广为引用的文字是:“云的崛起不仅仅使技客们(Geeks)得到又一个兴奋的平台。它无疑将改变信息技术产业,也将深刻地改变人们的工作方式和公司的经营方式。它将使数字技术渗透经济和社会的每一个角落,并在前进的道路上创造出一些棘手的政治问题。”[15]文中所说“棘手的政治问题”,点明了云计算对于国家层面与行业层面管理的挑战。
在应用云计算服务时,图书馆与其他行业一样,面临各种管理问题。综合国际上近年来对于云计算管理问题的研究,结合图书馆应用,我们认为这些管理问题主要是:
3.1 可替代性问题
图书馆应用云管理图书馆服务所需IT资源,理想状况是:存在若干相互竞争的大型的云提供商,以可拆分的方式为图书馆提供硬件、软件、系统、平台或基础设施的服务(XaaS,X as a service。X为用户所需IT资源)。也就是说,图书馆可以从不同的云服务中选择最合适的应用,混搭提供最佳的服务,而不是完全依赖于一个服务供应商。自2006年以来兴起的图书馆2.0应用,很多就具有这样的特征。如在OPAC方面,显示来自亚马逊网上书店或谷歌图书的封面,来自WorldCat中的读者对象或Librarything的用户标签、来自RSS的期刊最新目次等,是通过第三方的API或自己编制的小程序,将需要的内容即时抓取过来。
也就是说,图书馆应当既可以自由选择IT供应商,零成本地随时从一家供应商转移到另一家,也可以从不同的供应商选择不同的服务。只有这种状况下的云计算,图书馆才是可以接受的。如果不具备可替代性,不能自由地从一家服务供应商转移到另一家,或者转移的成本非常高,那么图书馆对云的依赖将变得非常强,相当于被云供应商绑定。如此后果不堪设想。从这一点来说,OCLC推出的“Web级协作型图书馆管理服务”之所以引起图书馆界的强烈关注,其中一个很重要的因素是它基于WorldCat中大量的书目与馆藏数据,具有一定的垄断性质。因而约翰·霍普金斯大学图书馆的技客Jonathan Rochkind对此评论是,他希望有更好的选择,从不同途径,混合匹配最好的组件[16]。
当图书馆选择云计算供应商时,固然需要考虑供应商的IT产品或服务的质量、价格、信誉等问题,但更要考虑可替代问题。没有可替代性,好的质量可能变差,低的价格可能上涨。即使是由国有大企业作为云计算企业,没有相应的制度,图书馆的利益也很难说可以得到保障。而一旦供应商所提供的云有了可替代性,就认可了用户的自由选择IT供应商的权利,也就具备了形成市场化的保障机制。
3.2 标准问题
要能够实现不同IT服务供应商之间的可替代,除通过相应的协议与供应商形成合同关系外,从技术上说,还需要IT服务提供商所提供的云计算能够遵循共同的标准。没有共同的标准,就不可能实现从一家供应商到另一家供应商之间的零成本转移。由于云计算发展迅速,大企业纷纷“抢滩”,因而标准问题更加突出。中国首届云计算大会期间,微软全球资深副总裁张亚勤在接受专访时表示,现在国内很多企业已经有意识地开始做云计算了,包括百度、阿里巴巴等知名的互联网厂商,但这些企业的云计算都是“私有”的云计算,缺乏兼容性。他认为应当建立专门的云计算委员会,大家共同建立开放性的标准,共同促进云计算的发展[17]。
在技术迅速发展的IT领域,期待国家制定标准是不现实的。当前云计算领域的标准,要么是像微软产品由于市场占有率奇高而自然形成的标准,要么是行业组织或多家企业联合制定的标准。例如,2009年1月,云计算标准制定组织“开放云联盟”(OCC)成立,思科、雅虎成为其首批成员[18]。2009年4月,包括AMD、思科、惠普、IBM、英特尔、微软等众多知名企业支持成立于1992年的标准化组织“分布式管理任务组”(DMTF)组建“开放云计算标准孵化器”[19],可见云计算企业对于建立云计算标准的关注。
上述机构建立的标准是必要的。它们至少能够保证不同的云之间具有互操作性。对于图书馆行业,关注的标准可能需要更加广泛一些,比如不但需要程序交互接口的标准化,而且需要支持不用再编程的可交互接口,支持数据的标准化,等等。《云计算权利宣言》对云计算的标准提出的四点要求或许可以作为我们认可企业提供云计算的评判标准。这四点要求是:(1)尽可能使用现有标准,而不是创立新标准;(2)有合适的标准时,应当使用开放标准:(3)不应该使用专有标准;(4)应该使用透明的数据格式。
3.3 数据安全和保密问题
数据安全对图书馆至关重要。无论是书目数据、读者数据还是流通数据,一旦丢失,后果都是不堪设想的。而馆藏文献数字化的数据,一旦丢失更令图书馆人心痛不已。可以说,图书馆人对于数据脱离自己的控制有一种本能的恐惧。但实际上,大型计算中心的硬件条件和管理能力比普通图书馆的IT管理能力要高出许多,因而单就技术而言,图书馆将数据置于云上不会比置于本地硬盘更不安全。
所以数据安全和保密问题,更多的是政策层面上的。云计算企业的管理政策、企业信誉,甚至国家政策,都可能对云计算数据的安全造成极大的影响。据Bill Thompson在BBC发表的技术评论介绍,加拿大政府的政策是不允许本国公共部门的IT项目使用总部在美国的托管服务,理由是美国的《爱国者法案》授权联邦调查局可以查看任何一台电脑上的内容[20]。最近美国政府要求微软公司切断5个国家的MSN服务,类似的政府行为也完全可能发生在云计算领域,成为国家云计算安全的隐患。
在美国,许多图书馆为了保护用户的隐私数据,不惜叫板《爱国者法案》。可以想象,在缺乏绝对的安全与保密的前提下,要图书馆人将图书馆的数据交给一家企业的云计算管理,对图书馆核心价值是一种多么大的冲击。
3.4 知识产权问题
用户购买云计算后,将自己的内容交给云,由云计算企业托管这些内容。理论上说,用户应该完全拥有被托管数据的知识产权。就是说,用户希望自己能够管理和控制这些内容,有权修改和删除这些内容,并且其他人不得使用和修改这些内容。这一要求,应该作为图书馆应用云计算的前提条件之一。但是在现实中,云计算企业深知“数据核心(Data is the Next Intel Inside)”原理,因而他们会千方百计地利用这些数据,并以数据整合、数据挖掘、知识服务的名义使用户数据利用合法化。近年来,OCLC利用WorldCat中集成的馆藏数据,开发出了一些新产品,如每季的大学与研究图书馆推荐书目[21]、作品的读者对象[22]。其Web级服务也就是云计算图书馆集成系统一旦上线,将会集成大量图书馆的本地读者信息及借阅数据,可以预计OCLC也会对其进行开发。这些数据与馆藏信息不同,本为成员馆所唯一拥有,如果用以开发而成产品,其知识产权的界定将成为新的问题。
事实上,当OCLC在2008年11月推出“WorldCat记录使用与传递政策”(Policy for Use and Transfer of WorldCat Records),试图取代20年前的“OCLC衍生记录使用与传递指南”(Guidelines for the Use and Transfer of OCLC-Derived Records)时,受到很大质疑,最终不得不在2009年5月宣布撤销,推倒重来。这正是网络环境下知识产权新问题的一个实例。
由于云计算而产生的知识产权问题,可能超出传统的知识产权法范畴。因此,已有学者提出,“云计算的独特问题可能表明,技术已经到达需要重新考虑知识产权许可的迫切地步”[23]。在我国制定网络信息传播的知识产权保护立法过程中,图书馆管理者和图书馆学家们表达了图书馆行业的立场,对于实现知识产权保护的平衡起到了一定作用。面临云计算可能导致的知识产权重新立法,图书馆人同样需要表达行业的声音。
4 如何应对云计算带来的管理挑战
通过对云计算在图书馆应用的分析,我们认为图书馆学理论界对于云计算研究的重心应该是云计算所带来的管理问题,包括:
4.1 云计算的基础理论问题
研究信息技术及其应用已成为现代图书馆学理论与方法的主体,云计算是信息技术的新领域、新趋势之一,可能对图书馆信息技术应用产生重大影响。云计算的理论问题包括云计算的概念、起源、基本理念、类型、特点,与现有计算模式的区别,等等。虽然这类研究的对象不是云计算在图书馆的应用或图书馆界对于应用的管理,但它能够促进或深化图书馆界对于云计算应用的认识,为图书馆应对云计算带来的管理挑战提供必要的政策思想与理论准备。
4.2 云计算在图书馆应用的可行性
尽管图书馆人在应用信息技术方面一直保持着勇于探索的姿态,但图书馆云计算应用——将应用系统和各类数据置于“云端”而非存放本地——与图书馆人信奉的“拥有”理念将产生冲突。因此需要研究云计算应用的可行性,结合云计算在图书馆和其他信息管理领域的应用,探索其可能应用的领域,研究云计算对于图书馆选择自动化管理系统、数据库及应用软件、OPAC前端或强化应用、数据存贮与共享等业务可能带来的好处,为图书馆IT管理选择XaaS提供理论依据。
4.3 图书馆云计算政策、标准与协议
通过对云计算相关政策的研究,促成相关管理章程、行业标准或政策的出台,保证将要实施的云计算能够符合图书馆管理与服务的基本要求。云计算的特点是能够给图书馆使用和选择信息服务的内容、工具和平台提供最大的方便,但这需要有较为严格的规章,统一、开放的标准,以及相应的政策作为支持。尽管云计算领域已经在关注标准和协议问题,但图书馆界对于云计算还应该有行业标准。图书馆的行业管理者应该组织对于应用云计算所需的标准和相关协议进行研究,形成行业的应用规范。同时还应该加强对云计算“管理服务提供商”(MSP)的研究,研究MSP的开放性、共享性、标准化、安全性能、保密级别以及企业的诚信与可持续发展性,研究MSP评价方法与测评指标体系。以便形成图书馆行业对于云计算应用的管理,保障图书馆的基本利益与数据安全。
4.4 基于云计算服务的图书馆管理体制
图书馆应用云计算是一项战略选择,尤其是在IT基础设施领域,图书馆一旦选择了云计算,则需要对原有信息系统的管理与服务进行大规模重新部署,导致IT管理体制的变化,甚至整个图书馆业务流程的变化。因此必须研究云计算这一IT基础设施变化可能导致的图书馆机构与流程的变化、IT部门人员数量与结构的变化、图书馆对于云计算服务的质量检测与控制手段,等等。
4.5 云计算案例研究
对于图书馆运用云计算的主要案例进行调研、测评、分析、研究。目前云计算在图书馆的应用并不多,但已经出现了一些重要案例,如图书馆集成系统方面有自称亚洲首个SaaS的集成图书馆自动化解决方案的Cybrarian(印度)、广州图创计算机软件开发有限公司的中小型图书馆自动化管理托管平台;WebFeat Express跨库检索系统;OPAC强化应用方面有LibraryThing For Libraries,以及如亚马逊API、谷歌图书API等,也可归入这一范畴。OCLC的“Web级协作型图书馆管理服务”即WorldCat Local的强化版将于2009年7月上线;2009年5月机构库二大开源软件Fedora和DSapce合并为DuraSpace,也将于2009年秋试用新产品DuraCloud,据称这是一个具有云存储与云计算成本效益优势的托管服务[24]。可以预计,今后将会有更多应用案例出现。对这些案例进行研究,从国内应用的角度评判这些应用案例的优劣,对于图书馆应对云计算导致的管理挑战是极为必需的。
收稿日期:2009年6月11日