以开放的心态迎接新的信息技术——2009年信息技术在图书馆的应用——图书馆面对云计算,本文主要内容关键词为:信息技术论文,图书馆论文,心态论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
近年来,IT业提出了云计算模式,即通过整合与利用互联网上已经存在的设施、服务、积累的数据与信息、专业化流程和技术支撑,用以构建本单位的IT应用。这种模式可以有效地提高互联网设施的利用率、减少能源消耗、减少对高技术人员支撑能力的依赖。IBM公司认为云计算是一种新兴IT实现模式,能在提高负载能力和优化服务上显著减少IT的费用和系统组成的复杂性[1]。美国加州大学伯克利分校的云计算[2]观察中,在云的基础设施提供者、软件即服务(SAAS)的提供者、基础设施的利用、互联网的应用和SAAS的利用等层次进行了费效分析与对比,证明了云计算模式的合理性。
在2008年2月举行的SUN公司全球教育与科研大会上,SUN公司总裁对云计算作了这样的描述:“什么是天?连接全世界的漫无边界、无限可延伸的互联网络基础就是天。什么是云?互联网上已经存在的一组一组的应用,就像一朵一朵的云彩。那么什么是云计算呢?就是以互联网为IT平台的,虚拟化的、计算机网络磁盘产品化的、各种应用标准化的,以在线服务和开放源代码为支撑的计算平台。”维基百科对云计算的定义是:“云计算是以互联网(云)为基础的开发与计算技术使用。”[3]著名的咨询公司Gartner认为,“云是一种计算方式,在大规模扩展与信息技术有关的计算功能上为多个外部用户提供横跨互联网的服务”[4]。处于不同的角度,对于云计算的理解是不同的。尽管至今没有一个关于云计算的权威定义,但是各方在云计算的特征认同上是一致的:首先是已经存在的互联网条件下的计算机与存储相关设施、已经存在的应用软件、积累的数据和信息以及专业化流程服务等,而不是为了云计算而重新构造一个崭新的应用模式。
2009年,图书馆开始尝试进入云计算领域。年初,迈克尔·斯蒂芬在博客中将云计算列入2009年图书馆界的十大技术趋势[5],刘炜在《中国图书馆学报》的一篇年度综述中将“亚马逊的云计算”作为典型技术进展之一[6]。正如他们所预料的,OCLC于2009年4月高调宣布即将推出基于WorldCat书目数据的“Web级协作型图书馆管理服务”[7],这被公认为是一项云计算服务。2009年7月,美国国会图书馆宣布在其国家数字信息基础设施和保存计划中测试云技术在永久保存数字内容方面的应用[8]。同时,对于云计算的分类与描述[9]是帮助图书馆正确理解与使用云计算的基础。
中国图书馆界从2009年下半年起,陆续在武汉、上海、北京等地的各种会议上对云计算进行专门研讨。以CNKI和万方数据库为数据源,时间设定为2009年,以“云计算”和“图书馆”为关键词进行“逻辑与”运算,检索出20位作者的22篇文章;而2008年只有1位作者的1篇文章。会议和文章数量的增加,说明图书馆正在关注、跟踪、研究云计算与图书馆的关系。
重视虚拟技术。在如今提倡绿色环保和低碳经济的时代,云计算中的平台复用技术就是把虚拟技术大量用于服务器、存储、顶层应用编程[10-11]等环节,借此有效提高硬件设施的利用率,减少设施的总量,从而达到节能减排的目的。虚拟技术主要分为硬件虚拟化、操作系统虚拟化、编程虚拟化三种类型。Gartner指出:“不能充分利用虚拟化技术的企业将会多支出40%的采购成本和20%左右的管理成本。”[12]
用友软件通过使用虚拟技术,“提升了服务器的利用率,提高了性能,能够支持更多的并发用户,从而有效节约了总的拥有成本”[13]。美国Dell公司“对非生产的计算机使用虚拟技术,3年节省6500美元/台,而生产用计算机使用虚拟技术,3年节省约9300美元/台”[14]。由此可见,对于那些利用率较低的设施来说,用云计算中硬件资源共享的虚拟技术来提高其利用率,从而减少设施总量是可行的。Gartner咨询公司预测,到2012年,20%的企业将通过利用虚拟技术、云服务等手段,不再拥有属于自己的IT硬件资产[12]。
国内有不少机构,例如国家图书馆、上海交通大学信息中心、西北大学图书馆等,已经着手在硬件环境中利用虚拟技术,在分别应用的服务器利用率比较低的前提下,将针对不同操作系统的应用,虚拟在一个硬件环境下进行使用。而存储设备的虚拟复用也逐步进入到图书馆的应用中。图书馆在跟踪与研究云计算时,应切实在提高IT装备有效利用率、减少电力消耗、增加一次投资的使用期限等方面进行量化考核,真正为绿色环保和低碳经济作贡献。
合理选择云计算模式。由于云计算在互联网上已经有大量的应用,如谷歌学术搜索网站[15]、亚马逊图书网站[16]、谷歌的电子邮件[17]、维基百科全书[18]等,因此,是充分利用好这些已经存在的云,还是自己重新建造云,这是图书馆人在研究云计算时争论比较多的问题。
Ellyssa Kroski把云计算归纳为“软件即服务(SAAS)”、“提供平台服务(PAAS)”、“基础设施服务(LAAS)”三种应用模式[19]。例如:可以利用FaceBook讨论各种问题;利用亚马逊的简单存储服务(跑);OhioLink利用亚马逊互联网服务技术;哥伦比亚公共图书馆利用亚马逊弹性云计算(EC2)托管网站,同时利用亚马逊的S3存储服务备份图书馆自动化系统和数字资源等;利用Google的字处理软件(DOC),收集互联网论坛信息;利用谷歌的应用接口(API)构造电子图书馆等应用;也有完全利用亚马逊环境建立自己的数字图书馆计划[20]。
在我国,对于绝大部分县级图书馆或者资金技术处于劣势的各类图书馆,应该在充分利用互联网上存在的应用方面下工夫,解决好本馆的图书馆自动化系统与其他云平台的链接、互操作、互交换等问题,在资源发现、资源组织[21]、资源服务上发挥云计算的优势。而对于省级图书馆、地级市图书馆或者资金与技术实力较强的图书馆,云平台的组织和建设方式既可以采用集中式,也可以采用分布式。所谓集中式,就是按照总分馆的建设体例,把图书馆自动化系统和数字图书馆集中建设在总馆,各个分馆充分利用末端能力组织使用者和进行云端资源的规模化集成。这种方式可以集中财政优势、技术优势和人员成本优势(只需一组维护人员)来管理和建设云,同时利用分馆和社区的优势去发展具体的服务接入。所谓分布式云系统结构,则是指有效运用互联网技术把一个地域内各个不同图书馆的应用系统连接起来,再利用负载均衡技术,使该地域内的每一家图书馆都可以分享其他图书馆的资源和技术平台。由于中国网络管理的特殊性,不适合把应用建立在国外的各种核心云计算平台上,可以采用以国内平台为主、国内外资源为辅的云计算应用模式。
互联网环境下的OCLC云计算环境[4]。OCLC基于互联网服务体系的云计算环境建设主要集中在四个方面。一是创建一个会员机构的用户环境,解决与会员图书馆系统相关的接口问题。2008年,WorldCat提供了与每个图书馆相关的馆藏定位服务接口。2009年,在美国和加拿大进行了移动终端导航定位到图书馆馆藏的实验,随后扩展到法国、德国、荷兰和英国,该步骤完成了OCLC的平台与图书馆自动化平台的链接工作,使得移动终端像计算机终端一样可以查询与定位馆藏。二是建立高效的图书馆工作流程管理系统——基于馆藏、馆际互借业务的图书馆管理。具有30年历史的馆际互借系统已经使得千万册书在图书馆之间进行流动,完备的计费系统和借阅系统功能奠定了图书馆传统业务的基础。同时,WorldCat的导航功能使得成员馆间的资源共享和无缝链接成为可能。在瑞士,已开发了新一代国家范围的元目录,开发了出版商的元数据服务,丰富了出版商的ONIX[22]元数据,使图书馆和出版商上游标题数据一致性得到了保证。同时,OCLC也努力使WorldCat系统与各个国家的联合目录保持同步,尽可能利用联检联查接口(SRU技术,Z39.50)进行系统间的互操作,进一步提高同步的效率,以利于与图书馆系统间的合作。OCLC还进行了为期六个月的专家社区实验(Expert Community Experiment),允许专家在网络社区进行工作,改善了图书馆编目的效率,并且提升了WorldCat主书目记录质量。三是将OCLC的Web服务作为图书馆业务的一个部分,利用OCLC的检索和馆藏查询,通过互联网来帮助提高图书馆资源的利用价值。四是提高OCLC的全球意义和地位。通过研究、宣传、参考物、网络连接、战略联盟等进一步提升OCLC的全球地位。
我国图书馆的云计算研究与实践。我国的CALIS[23]也提出了与OCLC的云计算相似的观点。但是CALIS的难点在于,面对2000所高校图书馆和60万所中学图书馆,如何进行互操作并解决互交换层的云链接关系。同时,CALIS管理中心、八大专业主题中心和各个省中心如何进行负载均衡,保证峰值访问服务能力,也是CALIS云计算设想中所面临的挑战。另外,如何使这种混合云系统在速度上和稳定性上满足各级教育图书馆的需求,也是难点之一。
2009年9月,首届“云计算与图书馆”专题研讨会在上海交大图书馆举行,有专家学者建议国家应建立一个集中的云计算平台给所有图书馆使用。但这个建议短期内很难实现,主要因为投资主体不同、各地区网络环境不同、峰值访问和闲时分配的集中性(而OCLC是面向全世界的,所以各个国家的时区差别平衡了峰值和闲时的矛盾,可以提高云计算平台的有效利用率)等会造成系统成本过高而性能和稳定性不够等问题。会上也有专家提出利用云计算理念在各个省构造一个为本省服务的图书馆云计算平台,或者构造一个基于云计算策略的总分馆类型的系统。尽管专家学者观点各异[24],但在云计算一定需要混搭模式这一点上却没有任何分歧。具体而言,就是把读者借阅相关信息、读者支付相关信息保留在本馆信息系统上,避免因为技术水平原因而造成更大范围的个人信息丢失,从而更好地保护个人隐私;而对于公共目录查询、虚拟参考咨询、馆际互借、数字对象服务等,可以利用远端云计算平台提供服务。这样的混搭模式,有利于在网络不稳定或者网络中断等情况下,维持正常的物理图书馆的到馆服务。
充分利用互联网的资源,使图书馆的资源和服务序化,这是互联网环境下图书馆人面临的课题。图书馆人研究云计算时需要思考如下问题:①互联网资源是分布式的,如何利用云计算将其与本馆的服务对象有机地实时联系起来,以解决传统图书馆正规出版物不能满足教育与科研需要的问题。②教育和科研用户还有很多其他的需求,如何利用云计算来组织服务以满足这些需求。例如谷歌公司的按需印刷(Print On-demand,POD)服务[25-26],资源和打印服务系统(Books printing services)在远端谷歌公司,POD机设置在图书馆里面,方便读者购买断版的各种书籍,图书馆也获得一定的回报。③各种辅助工具类的云计算资源可以帮助图书馆开展业务和提供服务,需要去发现并链接使用。比如:如何将Google的翻译工具与图书馆的检索工具进行组合,帮助不同语种的文献以中文呈现;如何利用Wiki平台发展本馆的Q&A、FAQ等以及建设本馆的知识库。