美国图书馆的云服务,本文主要内容关键词为:美国论文,图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
“云计算”是图书馆界近几年的热门话题,它是分布式计算、网格计算、并行计算等计算模型的新发展,它将服务器、应用程序、宽带等虚拟资源集成于一个大型资源池中,用户通过Internet高速的传输能力远程利用这些资源,并按需支付费用,它使人们摆脱了个人计算机有限的资源和处理能力的束缚,呈现出简单易用、超大规模、动态可扩展等特征。基于云计算的各种服务称为云服务,包括伴随云计算出现而产生的服务,以及在云计算出现之前就存在的、受云计算推动而进一步发展的服务[1]。2009年,OCLC的“Web级协作型图书馆管理服务”和美国国会图书馆DuraCloud项目的推出,标志着图书馆领域最早的云服务在美国诞生,Google、Amazon等商业云也在美国图书馆得到广泛应用。
1 OCLC提供云服务
OCLC的宗旨是推动信息检索、实现资源共享并降低信息使用费用,它将世界各地成员馆的信息资源、技术和专家集成起来,于2009年4月23日宣布创建了全球首个“Web级协作型图书馆管理服务”,被公认为是图书馆领域第一个云服务[2]。该服务的目的是降低图书馆费用,促进共同发展和提升用户体验。它将图书馆管理服务推向网络级别,使WorldCat Local变成基于“云”的在线图书馆自动化系统,从而实现Web级的流通与传递、Web级印刷本与电子采访、Web级许可管理、Web级自助配置、Web级工作流程、Web级合作情报等[3]。WorldCat Local还可与人力资源系统、财务系统等第三方业务流程系统进行互操作,从而降低图书馆管理总成本。图书馆订购FirstSearch WorldCat,即可免费获得WorldCat Local的“快速启动”服务。OCLC云服务的推出,标志着OCLC正式跨入云服务提供方的行列。
1.1 WorldCat.org
WorldCat.org作为全球图书馆在互联网上的入口,是OCLC为广大用户提供的云服务界面,它利用一站式检索平台进行资源检索、获取、组织与共享。
1.1.1 资源检索
WorldCat.org支持对图书资料、图书馆、列表和联络人等资源的检索。WorldCat.org提供了多字段检索,并可对年份、用户类型、文献格式等进行限定,从而实现全世界不同图书馆和机构资源的一站式检索;查找图书馆时,WorldCat.org给出了详细的检索提示,检索词只能是英文;检索联络人(即WorldCat资料档的建立者)时输入的检索词为用户名、姓或名;检索资源列表的检索词是列表名称或描述。
1.1.2 检索结果
WorldCat.org提供了多种检索结果处理和分析功能,帮助用户找到最需资源。①多种浏览列表:WorldCat.org检索结果默认显示最新列表,用户也可选择“现有列表”、“我推荐的资料”、“我拥有的资料”和“查阅的资料”这些列表对检索结果进行筛选。②多维度统计与分类:WorldCat.org利用载体格式、著者、年份、语种等多个维度对检索结果进行分类统计,大类下逐级划分子类,使原本孤立的目录联系起来,起到很好的导航与组织作用,能方便用户对感兴趣的内容进行逐级深挖。此外,利用“相关主题”、“相关著者”的链接还可实现对同一主题或同一著者文献的集中检索与深入研究。③多种排序方式:WorldCat.org检索结果按相关度、著者字顺、题名字顺或日期进行排序。④详略结合的信息揭示:WorldCat.org检索结果列表只显示每条结果的题名、著者、文献类型、文种等基本信息;进入资源著录页面,可查看内容丰富的详细信息。
1.1.3 资源组织与共享
WorldCat.org为注册用户提供了标签、列表、评论三种可供用户参与的信息组织方式。①标签,是用户建立的关键词,可为任意词语,有助于描述和分类资料,它能通过E-mail或Web2.0工具共享。②列表,是用户将自己感兴趣的资源加以集成组织而形成的列表,公开列表可与他人共享。③评论,是用户在资源著录页面添加的评论性文字,有助于揭示资源内容。
1.1.4 个性化服务
OCLC在云服务初级阶段从改善用户体验入手来改善云服务效果,为此,Worldcat.org提供了许多个性化服务。①WorldCat.org提供了中文、荷兰语、英语、法语、德语、葡萄牙语和西班牙语等7种语言界面,以减少不同地区用户的语言文字障碍。②系统可根据用户IP自动识别用户的地理位置,从而选择离用户最近的图书馆,用户也可输入国家、省、市等基本信息来选择想要利用的图书馆。③World.org提供APA、Chicago、Harvard、MLA、Turabian这5种版本的引证文献复制,允许用户将印证文献输出到RefWorks、EndNote、EasyBib这3种文献处理软件中。④WorldCat.org支持全球任何能够运行JavaScript、Opera Mini或Bolt等基于Java的网页浏览器的智能手机或功能手机,使用户通过移动访问服务查看资源位置、书架状态、索书号等,或进行预约、发送引文[4]。
1.2 WorldCat Local
WorldCat Local是OCLC为图书馆提供的云服务平台,可一站式检索纸质和数字资源,实现本地资源、联盟资源和WorldCat全球资源的整合。它能与本地图书馆的编目、流通、资源共享及全文链接软件等进行互操作,向终端用户提供无缝的使用体验。这些功能都可在WorldCat Local平台上实现,图书馆无需配置任何设备或维修人员,从而有效降低图书馆的运营和管理成本[5]。WorldCat Local还通过与搜索引擎、社交网络和其他热门网站的合作,提高图书馆的网络可见度。2007年OCLC与华盛顿大学图书馆合作测试WorldCat Local新服务并取得巨大成功,该馆向所属图书馆联盟借入的文献同比上升61%,馆际互借同比上升114%,2007年第四季度和2008年第一季度的网络访问数多了31 000次[6]。截至2010年,WorldCat Local服务的用户已达近千个,如,美国加州大学伯克利分校、康奈尔大学、麻省理工大学等的图书馆;英国的约克圣约翰大学图书馆;挪威BIBSY联盟的所有图书馆。
加入WorldCat Local的图书馆,网站首页会出现一个带有本馆特色的WorldCat Local板块。该板块包含WorldCat菜单栏、搜索框以及本地图书馆的标志、名称和符合图书馆需求的链接、背景颜色等。菜单栏提供帮助信息、多种搜索范围以及自定义菜单。图书馆可根据需要将本馆的主要服务、主要信息的链接放置于自定义菜单中。该板块还提供了参考咨询服务,即OCLC的联合参考咨询服务,它使图书馆通过共享全球资源以最少的投入获得最大的参考咨询效果。
WorldCat Local将检索结果划分为三级:本地图书馆的资源、图书馆联盟或集团中的资源以及WorldCat成员馆中的资源。用户通过“一键式”检索即可查看所有电子副本,这在一定意义上增加了本地资源,消除了以往多次点击带来的不便。WorldCat Local与图书馆的最新服务和实时流通数据相集成,用户可通过著录信息、标签、列表、评论来分析资料位置与价值,以寻找最合适的资源。
WorldCat Local通过查找帮助和社群工具对检索结果进行处理:分面检索可帮助用户按作者、格式、出版年份、语言或其他指标对检索结果进行限制;排序功能提供了多种排序方式;保存功能让用户在检索过程中随时保存检索记录,或标记特定资料并将其添加到个人列表中。
1.3 OCLC云服务特点
1.3.1 基于资源建设和动态数据
丰富的资源集成是OCLC云服务最重要的基础,从WorldCat、CORC到Connexion,OCLC实现了从馆藏资源、网络资源到多类型信息资源的联合编目。OCLC提供了全套云计算图书馆信息管理服务:联机合作编目,馆际互借和资源共享,WorldCat.org,WorldCat Local,QuestionPoint联机参考服务,CONTENTdm数字化馆藏管理服务,流通管理、采购服务和版权管理[7]。这些服务建立在OCLC资源集成的基础上,由联合编目服务衍生而来,以丰富的资源为后盾,提供编目数据、书目信息、馆藏信息、咨询信息等数据在成员馆之间的动态共享。
1.3.2 服务泛在化
丰富的资源入口和广泛的合作与服务对象促进了OCLC云服务的泛在化。OCLC致力于促进全球信息资源的共建共享,为提高信息资源的利用率和服务开放性,OCLC提供了多途径的资源检索入口。以WorldCat.org平台为例,就有至少7种资源入口:WorldCat.org网站;搜索引擎;成员馆网站;特定检索页面的WorldCat链接;WorldCat搜索插件;HTML内嵌的WorldCat标志和链接;WorldCat工具。OCLC坚持协作理念,同图书馆、出版商、学会、互联网等都存在广泛合作,培养了大量潜在用户。Open WorldCat等计划的实施,WorldCat.org和WorldCat Local两大云服务策略的出台,使更多用户接触到OCLC云服务。
1.3.3 服务个性化与人性化
OCLC云平台提供了丰富的个性化服务功能,例如用户个人档包含了列表、标签、评论、喜爱的图书馆、个人兴趣等功能板块,其使用完全依据用户个人喜好,满足个性化需求。个人档还具有一定社会化特征,例如用户对资源进行标注后就使标签、资源和用户产生了一定的联系,具有相同特征的资源和用户就很容易聚类,形成一定的社会化关系网络。OCLC还十分注重用户需求,不断调整服务方式。针对图书馆OPAC系统各自为政、难以共享的现状,OCLC于2007年开始试验WorldCat Local服务,旨在让Worldcat.org变成本地文献寻找与传递服务的解决方案,推动图书馆管理的集成化,降低图书馆的管理成本,改善用户体验。
1.3.4 服务兼容性
WorldCat Local能与大多数集成图书馆系统集成,与流通和馆际互借等本地服务兼容,图书馆用户可使用现有的借书证从其所在馆获取资料,并遵守图书馆政策享用馆际互借等服务。WorldCat Local通过使用目录记录中的OCLC控制号与ILS进行通信,获取本地图书馆ILS系统的流通信息,以便改善服务。它还支持图书馆在不同自动化系统之间的迁移,将WorldCat Local的使用过渡到新系统中。
2 美国国会图书馆应用云服务
2009年7月23日,美国国会图书馆国家信息基础设施和保存项目(NDIIPP)和Duraspace公司联合启动了Duracloud试点项目,以检测云技术在维持数字内容永久访问上的性能,纽约公共图书馆和生物多样性遗产图书馆也是最初合作伙伴。目前已有麻省理工学院、哥伦比亚大学、西北大学和莱斯大学使用Duracloud的托管服务以保护数字资源,但尚未见到上线产品或演示[8]。Duracloud的重点是为大学、图书馆、文化遗产机构、研究中心和其他有关各方服务,旨在实现以下目标:一是探索云计算技术的使用,以测试数字资源的永久访问;二是为各机构提供数据存储和访问服务,使各机构本身无需提供专用技术基础设施;三是探索除存储服务之外的资源访问战略。Duracloud跨多个商业和非商业供应商提供云存储和云计算服务,解开了数字内容存储在云中的关键价值[9]。
2.1 Duracloud云服务内容
Duracloud提供在线备份和同步处理,网络访问,文件格式识别,标记,多个存储云的访问,上传和下载网络资源,在线共享,文件完整性检查,流媒体、图像查看和图像转换等服务。
2.1.1 数字资源存储和访问服务
数字资源存储和访问问题是数字图书馆发展的瓶颈之一,Duracloud云存储实现了数据的集中管理、动态存储和同构访问,提高了数据的一致性、安全性、可靠性和可扩充性,降低了存储费用。首先,保存和归档服务提供统一Web界面用以上传、下载、查看和更新资源内容,创建资源副本并将其存储到不同“云”端。其次,在线备份服务通过Duracloud集成的不同云服务商提供在线备份和智能分布处理,用户只需在一个“云”端进行资源更新,自动同步服务会同时在所有“云”端备份资源副本。最后,完整性检查服务通过从底层存储供应商处收集每个存储项目的内容校验值,重新计算其校验值并比较不同清单间的异同,可以对资源的完整性进行检查,系统会自动生成一份检查前后校验值的比较报告。
2.1.2 媒体资源访问服务
一般浏览网页的过程实际是将网页内容下载到本地硬盘进行查看的过程,费时且费资源。Duracloud将图像和视频存在“云”端,通过嵌入式开放资源浏览器向用户提供资源,用户服务器无需做任何负担性工作。音视频服务支持MP3、MP4、FLV和其他格式流媒体文件的传递,它利用亚马逊的CloudFront服务将网页内容缓存在就近的CDN缓存器上,用户从这里直接读取,速度更快,不占电脑内存。图片服务使用Dojakota开源应用程序,直接从“云”端将图片转化成JPEG2000格式进行传递,用户可使用Duracloud浏览器查看图片。
2.1.3 其他服务
Duracloud在线协作服务提供统一Web接口和资源协作方式,使全世界的学者可随时上传下载所需资源,为资源添加标签,提供的在线协作工具可有效促进学术合作的开展。
Duracloud云代理服务整合了3家云服务商,通过一站式管理、每月账单以及统一Web接口来管理资源,一旦某个云供应商停止服务,用户的资源将不会被锁定,而是可以通过统一Web接口使用其他存储站点的备份资源。
2.2 Duracloud云服务特点
Dspace和Federa的合并产生了Duracloud,这对图书馆具有重要意义,他们通过技术、资金和社区资源的整合,共同推进数字资源的长期存储和访问。介于目前Duracloud没有上线产品,笔者将从DSpace和Fedora两大支撑系统的特点入手分析总结Duracloud的基本特点。
2.2.1 统一管理
Duracloud使用Amazon Web Services,Windows Azure和RockSpace三家云服务商提供的服务,Duracloud作为连接这些云服务商的唯一站点和代理商,为用户提供统一管理服务,用户无需跨平台跨系统,只需使用统一Web接口,即可实现对三家云服务商的同步操作。
2.2.2 开源性
Duracloud以Fedora和DSpace两大开源软件为支撑,体现出鲜明的开源性特征。Fedora是由一个大型国际社区开发和支持的开源项目,旨在通过协作的社区行为推进开源软件的快速发展。社区成员提供并维护开放源码的软件和开放标准,社区的价值观就是打造一个整合最前沿的开源项目,满足技术人员和技术爱好者的需求。DSpace是以内容管理发布为设计目标的开放源代码数字存储系统,它是一个开源软件平台,主要代码均为Java编写,可以运行于所有UNIX系统。DSpace使用的第三方软件也是开放的源代码,如PostgreSQL、JDK、Apache等。
2.2.3 有效支持数字资源长期保存
作为公共机构或终端用户程序与多种第三方存储服务之间的中介,Duracloud主要管理第三方存储服务程序的内容存储与检索,其目标是建立一种可信的媒介来提供不同层级的服务,使数字内容能够持久保存并有效访问。Dspace具有的许多特性,使得Duracloud对数字资源的长期保存成为可能。DSpace系统可以收集、存储、索引、保存和重发布任何格式和结构的资源,保证印刷和数字文献的统一索引与定位。DSpace对资源采用DC元数据标引,并由资源提交人员或标引审核人员编辑和修改元数据,为资源的保存、揭示、检索和利用提供良好基础[10]。DSpace支持“位”存储和功能存储,前者保证数字材料持久不变,可复原使用,后者使存储内容随时间而改变格式,及时淘汰旧格式。DSpce还用特定数字流格式来制定特定文件格式,以更准确地表达文件格式,DSpace提供的CNRI句柄还为每个数字条目提供了全球唯一的标志符[11]。
3 美国其他图书馆应用的云服务
3.1 图书馆应用Amazon云服务
Amazon是全球最大的在线图书销售商,拥有大量闲置的IT基础设施。2002年Amazon开始将闲置资源租赁给第三方,逐渐形成云计算服务,即亚马逊网络服务(Amazon Web Services,AWS)。AWS主要向企业提供托管式的云计算基础架构网络服务平台,包括虚拟机、在线存储和数据库、远程计算处理以及一些辅助工具。用户无需管理和维护,只需根据使用状况付费。在图书馆界,俄亥俄州图书馆与信息合作网(Ohio UNK)使用Amazon云服务管理一些公共数字资源,匹兹堡大学使用EC2服务托管该馆的网站,用S3服务备份图书馆集成系统,并且还计划用Flickr和EC2服务管理未来的数字馆藏资源[12]。
AWS由4块核心服务组成:简单存储服务(Simple Storage Services,S3)、弹性云计算(Elastic Compute Cloud,EC2)、简单排列服务(Simple Queue Services,SQS)以及Simple DB。它们分别承担着存储、计算、消息传递和数据集的功能,四者协作运行,内聚协调,为各种应用程序提供了一个完整的解决方案。EC2提供了可定制的云计算能力,用户可通过“即买即用”的模式快速增减计算资源。它拥有小型、大型、极大三种不同能力的虚拟机实例,不同程序可通过实例间的内部网络进行通信。S3提供无限的数据存储空间,用户可通过授权统一Web界面来存储和访问网络上任何地点的数据[13]。SQS使托管主机可以在存储计算机之间发送消息,即使消息接收方还没有启动任何工作模块,服务内部也会缓存相应的消息,以待接收组件启动后提交消息,从而增加了不同任务应用在分布组件之间的工作流[14]。Simple DB是经过优化的非关系型数据存储,它以Web服务的方式进行数据项存储和查询请求,可自动创建和管理多份数据以确保数据的高可用率和稳定性,消除了繁重的数据库管理员工作。
3.2 图书馆应用Google云服务
Google的云服务理念是将互联网建设成为一个数据中心和计算中心,提供安全、高效的数据存储和网络计算服务,用户只需将数据和应用程序存储在Google的大规模服务器集群中,通过Internet就可以随时随地访问和使用资源。目前,加州理工学院图书馆使用Google Docs服务收集图书馆与用户的互动信息,把Google Calendar作为用户培训和会议安排的参照表,用Google Analytics获取其他图书馆目录、相关网站的数据信息。美国东部州立大学使用Google App Engine服务来提高数字图书馆的工作效率,并把图书馆丛编流通数据库以及政府出版物管理数据库转移到Google App Engine上。
Google云服务包括软件应用服务、开发平台租赁服务和存储服务。软件应用服务是指Google在云计算基础设施上开发了一系列网络应用程序,如Gmail、Google Calendar、Google Docs等,它们带给用户全新的界面感受和强大交互能力。开发平台租赁服务基于Google App Engine,它是基于Google数据中心的开发、托管和运行网络应用程序的平台。该平台资源充足,并可随通信量和数据存储需求的增长而轻松扩展,支持使用Java和Python语言编写的所有应用程序和大型并发程序,用户无需提供和维护任何服务器。Google存储服务目前只支持个人Google账户,用户可通过Web管理界面或gsulti这个开源命令行工具来管理存储内容。
4 美国图书馆应用云服务的启示
4.1 利用云计算开展互利合作,加强资源共建共享
实现信息资源共建共享是图书馆不断追求的目标,云计算的特征之一即共享,例如OCLC云平台将世界各地的图书馆和信息机构的资源与服务集成整合,扩充了资源总数,并提供联合编目、馆际互借、资源共享、联合采购、联合参考咨询等一系列基于动态数据的云服务,促进了资源的共建共享。云计算为图书馆的发展开拓了新的发展局面,它使图书馆员从非核心业务中解放出来,从而更专注于图书馆信息服务。图书馆应树立合作理念,充分利用云计算优势,积极构建云平台,加强机构间合作,拓展资源建设和利用渠道,实现资源、服务和技术的集成与共享。
4.2 综合分析,科学利用各种云服务
图书馆在选择和利用云服务时,应综合考虑自身需求和云服务提供方的优势所在。OCLC是图书馆领域专业的云服务提供方,拥有丰富的图书馆资源和实践经验,具有开展大规模图书馆云服务的优势,CALIS也有类似性质,它们的服务将更加契合图书馆自身和行业的需求,图书馆应尽量选择图书馆专业云服务提供方。还有一些云服务提供商凭借自己在技术、设备、网络和市场运营等方面的优势,也提供了有效的云服务,例如亚马逊的弹性云(EC2)可以帮助图书馆托管资源和应用,Google提供的各种应用程序可以有效地改善图书馆的日常业务。
4.3 充分利用用户力量,推动图书馆云服务
Web2.0环境下的图书馆用户既是资源利用者也是创造者,具有资源建设的巨大优势。Duracloud云服务成功的重要基础就是对开源社区和用户力量的利用,图书馆应充分重视用户的作用,制定一定的激励机制,鼓励用户进行资源和应用程序的开发,以及云服务的体验和优化。图书馆可将云服务嵌入用户的网络社区,让用户直接无障碍地体验云服务,并通过网络交流口口相传,利用用户的“口碑营销”方略提高云服务的利用率。此外,图书馆自身要加强自主创新,努力建设一支高水平的技术骨干队伍,加快建设数字图书馆云服务平台。
4.4 关注用户需求,调整服务结构
用户需求决定图书馆服务,图书馆服务结构应根据用户需求的变化做出相应调整。OCLC十分注重用户需求的研究,发表了不少关于用户需求的报告,其推出的WorldCat Local服务旨在帮助用户实现“一站式”检索,它还根据市场的变化,为出版商提供元数据服务。在云环境下,图书馆应将用户信息服务作为工作重点,深入开展用户研究工作,了解用户的潜在需求和个性化需求,通过云平台提供“一站式”服务、个性化服务、知识服务等创新服务。有信息的地方就有图书馆的用武之地,因此图书馆的发展空间十分广阔,例如开展信息传递、资源导航、专家交流、科研指导、职业和兴趣培训等,使图书馆服务走向社会,从而真正体现图书馆的价值。
4.5 辩证看待云服务,降低云计算风险
任何事物都是利弊共存的,我们在看待和使用云服务时应坚持辩证的态度。一方面,云服务具有安全可靠、低成本、快速高效、服务泛在化、以用户为中心等特点[15];另一方面,它也存在优先访问权、管理权限、数据处所、数据隔离、数据恢复、调查支持和长期发展等方面的风险[16]。但云计算并非凭空出现,其实质是对图书馆传统服务理念的继承和发展,意在促进人们更方便地使用信息资源,这将是图书馆不断追求的目标。云服务应用于图书馆的一系列成功案例表明了云服务的巨大潜力,因此我们应努力降低云计算风险,推动云服务在图书馆界的应用。为此,我们可以从以下方面努力:一是根据自身需求,做好云计算战略规划,区分哪些资源存储在“云”中,并做好安全控制工作;二是评估风险,比较资源存储在“云”中和内部系统中的风险,以及不同云服务提供方的优缺点;三是选择合适的云服务提供方,通过试验降低图书馆云计算实施的风险,并积累实施云计算的经验[17]。
收稿日期:2012-04-15