基于Web规模信息技术的图书馆网络模型重构策略_图书馆论文

基于Web—Scale IT的图书馆网络范型重塑策略,本文主要内容关键词为:图书馆论文,策略论文,网络论文,Web论文,Scale论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      1 引言

      Gartner在2014年发布的十大战略性技术趋势报告中提到了Web-Scale IT,即网络规模的IT,指出未来越来越多的企业将以Amazon、Google、Facebook等互联网科技巨头的方式去思考、行动和打造应用程序和基础架构,重塑提供信息技术服务方式,去进行用户创新、业务创新和协同创新,提高效率、降低成本,并预测2017年全球2000家世界级企业中将有50%采用Web-Scale IT,而2013年只有10%的企业使用这样一种架构[1]。Web-Scale IT架构是一种世界级别的计算模式,它可以通过企业IT的设置,传递大型云服务供应商的性能,并在多个层次上重新定位网络关系。Web-scale IT是互联网机构影响、颠覆传统IT解决方案趋势的一个落脚点,所建的大规模和超大规模数据中心表现出的高可扩展性、灵活性以及低成本都与传统数据中心的僵硬、复杂和信息孤岛形成鲜明的对比。

      即使我们为了适应网络时代的发展,在不断的扩大硬件规模、为系统扩容升级,图书馆也不再是信息资源的中心,不再拥有对用户的巨大吸引力。Web-Scale IT为图书馆提供了一种思维、一次与用户一起重塑网络信息环境和平台的契机,把图书馆重新拉入以Amazon、Google、Facebook等引领者构建的网络信息生态环境中,找到我们的坐标位置,发挥图书馆的网络空间价值并创造新的价值。

      文章从Web-Scale IT的世界环境出发,简单介绍了Amazon和Twitter的架构方式和实践,分析了目前国内图书馆的困境和美国OCLC类似的成功架构模式,归纳了Web-Scale IT的特点及优点,并基于Web-Scale IT的理念,从基础设施、存储平台和创新应用三个层次提出重塑图书馆网络环境的策略,发挥信息知识中心的权威性角色,让每一个人、每一个机构都能在图书馆的平台上有所作为。

      2 Web-Scale IT的世界环境

      在当前世界的网络环境里,Amazon主宰着在线零售业、Facebook和Twitter支撑着个人社交网络、Apple APP里创新着各种移动应用,每个人的工作、生活与之息息相关。Web-Scale IT的理念和架构把社会网络与个人网络连接和融合起来,并在信息流动的生态循环中不断创造新价值。

      2006年的Amazon是一个为了卖出更多图书而自建IT基础设施的电子商务公司。现在Amazon的AWS[2]和EC2[3]已经是全球公认的部署Web扩展应用的公有云简称。一个书商如何成为一个大的云供应商?为了在线业务的成功,Amazon需要高级的IT基础设施,但这会带来昂贵的开销,于是Amazon通过开源软件和向别的销售商购买他们未使用的基础设施的使用权,来创造属于自己的基础设施。它构建了一个Web-Scale IT模式的平台,共享、开放、可扩展,在这个网络规模的平台上“它允许客户专注于他们的服务,而不是变成IT专家”。

      Twitter出道之初只是个奋斗在RoR[4]上的小站点,而如今已拥有1.5亿的活跃用户,系统日传输tweet更多达4亿条,并已完成了以服务为核心的系统架构蜕变。没有开源,就不可能有Twitter,通过不断修改代码满足快速变化的用户需求。Twitter从开源社区中获得了大量的好处,同时它也在不断的回馈社区,开源了大量基础设施和工具,使得其他机构和开发者不必重新发明,而是在这些开源项目的基础上更加快速的实现自己所需。这种Web-Scale IT模式的创新构建,不仅利用网络的力量壮大了自己,而且将自己的价值通过影响和改变世界的方式体现出来。

      3 国内图书馆的困境及OCLC的成功

      曾经的时代,信息资源因缺乏而显得珍贵,丰富的资源总会吸引来更多的关注;今天的世界,信息资源丰富甚至泛滥,吸引用户使用资源和平台是重点。曾经,图书馆是用户的焦点,因为拥有信息提供者的权威地位;今天,国外如Amazon、Ebay、Facebook、Twitter,国内如微博、微信、淘宝、QQ,像空气般充斥在每个人的身边,提供信息资源、互动平台,便利生活、嵌入工作流程,创造价值。而国内图书馆,即使为了适应网络时代发展,不断扩大硬件规模、为系统升级,但在整个网络生态的信息链条中,依然无法拥有一席之地,用户正在远离我们,图书馆的价值也越来越被忽视。

      国内图书馆的困境到底在哪里?在硬件吗?在软件吗?在经费吗?都不是,突破口在于如何摆正自己在网络世界中的位置。要发挥我们的作用,先要找到我们在网络中的空间。

      这一点,OCLC[5]作为图书馆界的一个公益性组织,今天所发展到的形态、规模以及网络环境中的位置,是践行Web-Scale IT架构的图书馆界的成功代表,值得我们去认识它、研究它。

      OCLC目前已经发展到170个国家的规模,会员数达到16 737家,涵盖了世界各地的图书馆等机构。它推出的World-Share[6]平台服务是一个全球化的数字图书馆网络体系架构。它将世界各地成员图书馆的资源、技术和专家结合起来,将图书馆的服务搬上网络。让各图书馆成员可以共享硬件、服务和数据。可以说,World-Share基于Web-Scale IT创建了首个万维网规模的协作式图书馆管理服务。World-Share通过一个网络浏览器,将日常的后台图书馆服务流水化,包括采购、编目、流通、用户管理、资源共享和电子资源管理等。World-Share的成员可以利用这一平台共享服务、集成应用程序、强化工作流程,使用户获取更为丰富的资源和服务。

      

      World-Share平台的体系架构如图1所示,底层为云计算的基础设施和技术支撑,这些设施都是共享的。在此之上,World-Share服务包括三个部分:(1)World-Share Management Services(WMS)。它包含元数据管理、采访、电子资源管理、流通管理、馆际互借等。它将图书馆业务移植到云计算网络中,使成员图书馆不仅可以利用WMS将图书馆的数据存储到云中,共享基础设施和资源。还可以使用WMS网络级的应用程序,来简化图书馆工作流。各个图书馆可利用WorldCat Local这个统一搜索渠道为用户提供各种信息服务。(2)World-Share Platform。它是一个全球化的应用程序平台。各个图书馆和第三方机构可以开发各自的网络应用程序,共享到OCLC World-Share App Gallery这个平台上。这样,一方面,图书馆员可以在APP Gallery中选择实用的解决方案,并将其放在现有的工作环境中,简化工作流程;另一方面,各方的开发人员可以利用共享数据,进行合作创新,创造更多应用程序。(3)OCLC全球数据中心。World-Share的核心就是对共享数据的支持。OCLC以Worldcat共享数据为基础,在世界各地设立数据中心支持OCLC World-Share和其他服务。WorldCat是一系列的数据库。它的数据由世界各地的图书馆贡献、维护和共享。

      OCLC的使命是利用全球网络连接各个图书馆,以便管理和共享全球知识,并形成致力于图书馆合作的价值,资源共享的价值和普遍访问的价值。OCLC的主要产品及服务如表1所示,它通过连接、开放、共享,让其成员可以找回时间来关注自身的业务重点、共享全球的资源来满足本地馆藏需求、提供图书馆与每个人息息相关的连接、提高数字化馆藏的可用性。现在的OCLC已经是一个全球知识资源共享联合体。

      

      相较OCLC而言,我们还是一种各管各的意识。我们的联合机构有两三个,我们的馆际合作群体也有两三个,但都是相互独立的、孤立的。图书馆之间需要的是开放,而不是独立,向外开放然后再联合起来,联结成一个整体。

      4 Web-Scale IT的优势和特征

      Web-Scale IT利用网络的力量构建共享、可扩展的平台,为用户的需求提供服务,以网络规模运作,将服务在网络上聚集起来。这种模式可以应用在各行各业,但都具有一些共同的优势和特征。

      4.1 Web-scale IT的优势

      (1)Web-Scale IT的规模平台提供了共享的基础设施。它为平台的用户省去了重建平台的开销和投入,可以在自身业务的发展和创新上,激发各个行业不断创造新的应用。比如EBay、Amazon允许一个普通人可以成为销售商,在线卖东西;Facebook、Youtube在15年前也无法达到现在的规模。

      (2)Web-Scale IT的规模平台可以带来巨大的网络影响力。比如越多人在EBay买东西,就吸引越多卖家加入,EBay越多卖家,又可以吸引越多买家。越多人从Amazon购物,越多越好的推荐和评价就会被越多人参考使用并分享到社交网站、产生越多链接,在网络世界里带来巨大的影响力。

      (3)Web-Scale IT的规模平台汇聚了社会化的互动,累积了大量可分析的行为数据。它促进社会团体在共同的兴趣爱好,如音乐、书籍、手艺、职业上的交互,并收集用户行为数据,改进服务、开发出更好地与用户间的互动关系模式。

      (4)Web-Scale IT的规模平台调动各行各业的力量。共享、开放的平台允许开发者和第三方获取相应的网络服务并创造更大范围的新应用,提供给用户使用。

      4.2 Web-Scale IT的特征

      Web-Scale IT具有敏捷性、弹性和经济性的特征。它利用大规模聚合的数据创造新的价值。如Google拥有大规模的搜索索引和广告数据、EBay拥有大规模的销售和购买单据、Amazon拥有大规模的在线交易信息、Facebook拥有大规模的社交数据。它通过连接的用户创建大规模的参与型网络社区组织,形成良好的信息和价值流动链条。它提供可共享的基础设施,避免了重复的硬件投资和资源浪费,不需要再承受本地缓慢的速度,有了更快、更灵活的业务支撑与实现,随业务需求的资源的动态发展、帮助用户构建复杂、可扩展的应用,并分享新的升级和改进。

      5 基于Web-Scale IT重塑图书馆网络范型的策略

      5.1 Web-Scale IT的理念

      网络应用程序规模变大,需要存储更多的数据、服务更多的用户、需求更多的计算能力,传统的业务模式遭遇挑战,我们需要进行扩展,不是纵向的升级投入硬件(scale-up),而是以Web-Scale IT的理念横向的扩容(scale-out)[7],向更具成本优势,拥有弹性的计算、存储、网络的系统架构发展。以一种共享、开放的态度聚集基础设施、资源和应用,根据特定的需求进行敏捷开发、调度组合,不再是一味专注本地硬件的投入、软件的开发,而是将自身作为网络中信息流动链条的一个节点,参与到数据流动循环中、共享数据流动创造的新价值。

      图书馆作为社会的文献信息服务机构,要在网络中参与信息流动,做引领者,不要做跟随者。在Web-Scale IT生态里,世界图书馆聚集和分享数据、共享基础设施和管理应用,提供了系统范围的智能和创新、提高运行效率的平台,将图书馆相关馆藏信息提供给合作伙伴进行再加工用于网络应用的第三方组织,如搜索引擎、社交网站等,像一个全球社区规模的合作。伴随提供给图书馆用户的价值越多,被使用的图书馆就越多。通过Web-Scale IT模式的合作运行,图书馆可以共享其他行业的成果,如图2所示Web-Scale IT图书馆生态。

      5.2 混合云模式的基础设施

      最新思科云指数报告[8]表明,到2018年,超过3/4的负载将在云数据中心处理,22%的负载在传统的数据中心处理。云流量的增长促使每个企业都在做云迁移或考虑向云迁移。创建私有云、使用公有云还是选择混合云,大家都在试验哪种选择最适合自己。

      

      Gartner最新报告中有一组数据很有参考性,公有云将按照年均25%的增长率达到440亿美元,而与此同时,私有云市场虽然增速在4%左右,但是市场规模却可以达到20000亿美元,这意味着,“混合云的市场前景很大”[9]。

      不同的云,有其不同的优点,如表2所示。对图书馆而言,选择动态混合云创新服务、拓展应用较为合适,原因有三:第一,图书馆与用户相关的业务数据,关乎隐私安全,采用有安全边际的私有云更有保障;第二,网络环境下的图书馆不能再竖起封闭的高墙,需要在开放的网络平台上进行数据流动,以Web-Scale IT的模式共享和拓展,通过公有云可以快速展开业务应用;第三,眼光放长远,将来所有的云模型都需要进行互相连接,使用混合云将现有的数据中心扩展成某种类型的云更为容易,混合云的动态特性允许组织按比例快速变化。

      

      5.3 关系型和NOSQL混合存储结构

      网络环境下,数据按PB、EB级别的爆发式增长,基于Web-Scale IT的图书馆不仅需要处理海量的数据,而且自身也随着服务领域的扩展、新型应用的层出不穷不断产生复杂而多样的数据。由于大数据的5V特征,即Volume、Velocity、Variety、Veracity和Value[10],对于处于大数据环境中的每一个机构而言,必须根据自己的业务特点做出变化。数据量(Volume)巨大、产生速度(Velocity)快,不仅需要收集分析数量庞大的数据,而且响应和处理要快速敏捷。除了结构化数据,还包括各种非结构化数据,处理的数据类型多样而复杂(Variety)。数据在虚拟世界里流动,却与真实世界息息相关、充满真实性(Veracity),通过对其进行复杂、综合的处理、分析,才能提取出高价值(Value)的有用信息。

      图书馆不仅后台数据库隔离、独立,而且业务几乎建立在关系型数据库之上,这显然不符合当下数据环境集群性、并发性、融合性的特点,这也是图书馆似乎永远处在全球信息数据环境流动链条之外的原因所在。

      传统的关系数据库具有高可靠性、高稳定性、高一致性,但是网络应用程序的规模日渐扩大,我们需要存储更多的数据、服务更多的用户以及需求更多的计算能力。为了应对这种情形,NOSQL技术被如Amazon、Facebook广泛采用,它采用横向扩展、通过大量节点的并行操作实现大规模数据的高速处理。NOSQL(Not Only SQL)[11],非关系型的数据库技术。它具有易扩展、大数据量、高性能、灵活的数据模型、高可用的特点。图书馆把自己放到全球网络环境中去考虑,需要面对海量交易数据、海量交互数据和海量处理数据。各类型数据有其不同的特点,一味的放弃关系型数据库而追求NOSQL,并不是一个明智之举。图书馆的对事物要求很高的核心业务、本地业务,如财务、人事等,依然需要事务处理系统的核心引擎关系数据库来保障其数据的准确性和一致性。而一些需要扩展、需要支持多样数据类型,如图数据,还有社交化、移动化以及面向外部用户的应用系统,则可以考虑采用NOSQL技术。因为在这些应用场合,他们的操作并不需要ACID[12]的一致性约束,但是需要处理大量的数据、需要敏捷的反应和处理速度。

      关系数据库技术擅长结构化数据的处理,一致性、准确性高,但在扩展方面有瓶颈,而NOSQL技术则在扩展能力、数据的多样性、分析的复杂度方面擅长。我们认为,最终这两项技术将会走向融合,图书馆在这条融合之路上不仅要跟上步伐,而且应贡献作为信息提供者的力量、体现自身的价值。

      5.4 敏捷开发、智能嵌入社会信息流

      如果说曾经或现在的图书馆是以信息提供为精髓、以互动参与为重点,那未来图书馆的关键词是“引导”。基于Web-Scale IT的互联网思维,从图书馆的形态、资源和信息服务,以开放、共享的方式打造横向扩容的网络规模,利用混合云计算节省基础设施的开销、通过关系型和NOSQL的混合存储,兼顾事务型系统的同时,处理和分析好海量的类型多样的数据,让图书馆不仅重新拥有时间和精力关注自身业务的创新,进行敏捷开发,用户在图书馆员的引领和指导下,体验到更加人性化、智能化和个性化的信息服务,而且融入全世界信息流动的循环中,与合作伙伴、用户一起创造网络信息环境。

      从图书馆的服务形态上,国内的图书馆需要转换“立足本馆”的传统思维模式,将图书馆联合起来建立联盟,利用知识挖掘,合理聚合信息,构建知识图谱,建立泛在信息环境,提供知识服务。除此之外,强调信息空间与物理空间的融合,物理实体与数字化信息、服务的绑定,任务与信息之间的动态、透明交互,图书馆嵌入社会的每个角落,形成“图书馆智能空间”[13]。

      从图书馆的数字资源上,网络环境下数据量巨大且分散、异构特征显著,吸引用户的是资源所包含的知识,图书馆的工作不再是把大而广的资源原封不动的呈现到用户面前,而是需要对信息资源进行再加工,通过知识挖掘、建立知识关系链,为用户提供满足其需求的、个性化的、准确的、定制的知识信息。

      从图书馆信息服务上,目前在服务对象、资源条件、服务方式上仍然没有脱离传统服务模式。用户所专注的是任务的处理,图书馆应该直接嵌入用户需求环境中,及时、主动、有针对性地提供信息服务。例如通过识别和情景感知用户的信息行为,预测其信息需求;主动推送丰富的资源及服务;用户能够方便的显示或蕴含式与各类信息资源互动;保障用户随时随地将自己的移动设备与图书馆的智能空间无缝衔接。2010~2020年将是网络化、个性化的时代[14],用户急需在杂乱无章的信息当中寻找适合自己的、精准高效的信息,Web-Scale IT的图书馆通过高速互联的计算机网络,应用云计算、大数据、语义Web技术、Mashup技术和Web3D技术等打破空间和时间的限制,将全世界范围内的知识资源组织联合起来,对信息资源按统一标准进行存储、管理并提供给用户。譬如德克萨斯大学图书馆开发了20多个应用服务小工具,涵盖搜索、信息组织、共享协作等。用户可以在个人环境如Facebook、iGoogle中,快捷地使用各类知识资源[15-16]。

      6 结语

      通过Web-Scale IT理念以及相关技术重塑的图书馆网络环境是一个面向对象的、分布式的网络结构模式,实现了信息空间、物理空间以及社会空间的融合。在这个融合的空间中,人们可以随时随地、透明地获得数字化的服务。人们可以在任何时间、任何场所,都能像呼吸一样自如地访问它,获取“无所不在”的图书馆信息资源和咨询服务,实现“人—机—物”三元世界逐步深度融合。

标签:;  ;  ;  

基于Web规模信息技术的图书馆网络模型重构策略_图书馆论文
下载Doc文档

猜你喜欢