美国推广大数据的应用实践及其有益借鉴&从图书馆的角度分析_图书馆论文

美国推广大数据的应用实践及其有益借鉴&从图书馆的角度分析_图书馆论文

美国推进大数据的应用实践及其有益借鉴——基于图书馆视角的分析,本文主要内容关键词为:美国论文,视角论文,有益论文,图书馆论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

网络技术和通讯技术的迅猛发展,将“以全社会公众服务为己任”的图书馆推向了“风口浪尖”。新信息技术的发展和用户需求的变化促使图书馆服务内容和服务方式发生变革,图书馆服务逐渐向高附加值的知识创新型服务延伸和扩展,这势必牵涉到对图书馆大规模的海量数据进行数据分析和数据挖掘,从中提炼出有价值的知识。近两年来,国外掀起了大数据(Big Data)的研究和应用热潮,其中以美国最为突出,而国内对大数据的研究尚处于起步阶段。笔者通过检索国内三大数据库后发现,目前我国图书馆与大数据的相关研究文献数量较少,研究的力度不强。大数据作为当今盛行的新兴信息技术之一,对图书馆的技术提升和服务效率的提高具有较大的现实意义。本文主要探讨美国推进大数据的应用实践,并从图书馆视角分析其对我国的有益借鉴。

1 大数据概述

有人认为大数据等同于海量数据,其实二者是有区别的。大数据的内涵和外延超过海量数据,不仅仅指数据量大的数据,更是指大数据的价值大,数据处理速度快、效率高[1]。目前业界对于大数据的定义尚未完全统一,较典型的有:国际研究机构Gartner指出,“大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产”[2]。维基百科将大数据定义为:“大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。”[3]

研究者认为,大数据是当前数据分析领域的前沿技术。简单地说,大数据技术即是从各类型的数据中快速获得有价值信息的能力之技术,该技术具备走向众多企业的潜力。一般认为,大数据具备四和基本特性,或简称为“4V”特征:数据容量巨大(Volume),从TB级别跃升至PB级别甚至更高;多样性(Variety),大数据异构和多变;处理速度快(Velocity),大数据实时生成,要求准确、实时的数据分析和挖掘;价值大(Value),大数据中蕴含着巨大的财富和新的有价值的业务信息[4]。大数据技术的重大战略意义主要表现在对含有现实或潜在意义的庞大数据进行专业化的数据分析处理和数据挖掘,揭示数据的实用价值,而不仅仅是存储和拥有这些庞大数据。也可换一种角度思维:可把大数据比作社会产业链的一部分,该产业链帮助企业实现盈利的关键环节即在于提高企业对数据的分析和提炼能力,进而实现数据的“增值”。正因为这一点,国外发达国家的企业界看到应用大数据的商机,掀起研究和应用大数据的热潮。同时,大数据技术也可以助推图书馆界改善基础服务体系,拓展增值性的附加服务。

2 美国推进大数据的应用实践

2.1 政府主导,全体动员,支持大数据的研发

据美国互联网数据中心的调查显示,当今互联网上的数据每年增长50%,各个部门和机构的数据汇集起来将产生海量数据[5]。作为全球知名咨询公司,美国麦肯锡咨询公司最早提出“大数据”时代已来临,人们对于大数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来[6]。美国知名的信息技术公司如Microsoft、Google等纷纷开展大数据的研究和应用,从凌乱纷繁的大数据中发掘出符合用户兴趣和习惯的产品和服务,并进行针对性的调整和优化,成为大数据的重要应用价值之一。特别值得一提的是,美国政府高度重视大数据,将其作为全球性发展战略计划。美国奥巴马政府在2012年2月宣布推出“大数据的研究和发展计划”,又于3月29日在美国白宫网站发布了《大数据研究和发展倡议》(Big Data Research and Development Initiative),计划投资2亿多美元,在美国国防部、国家科学基金会等六家政府部门的协作下,大力推动及改善与大数据相关的采集、组织、分析及技术、决策等工作[7]。涂子沛先生的专著《大数据——正在到来的数据革命》从美国奥巴马政府建设“前所未有的开放政府”出发,描写了半个多世纪以来海量数据对美国社会政治、商业、文化等方面的影响,引起了较大反响[8]。笔者以《大数据研究和发展倡议》作为典型实例,对美国政府号召全社会民众出资出力,支持大数据的研究和发展情况进行简要分析。

早在2011年,美国科技领域较权威的机构——总统科学技术顾问委员会(President's Council of Advisors on Science and Technology)就提出建议,认为大数据及其相关技术的研究具有较重要的战略价值。白宫科技政策办公室在此基础上发布了《大数据研究和发展倡议》,旨在提升美国利用大数据获取有价值知识的能力;在国家安全、环境保护、生物医药研究、教育科研等领域利用大数据技术进行突破;协助科学、工程领域的创新;转变学习模式等。美国特别重视政府信息资源的开发利用,力推政府开放平台(Open Government Platform),为大数据技术的发展提供原材料。除了政府主导外,《大数据研究和发展倡议》还动员美国其他的利益相关机构,倡导美国联邦政府希望与企业、非营利性机构、科研院所等一起,迎接大数据时代的到来,共同面对大数据创造的机遇和带来的挑战[9]。这些相关机构已经着手投入到大数据的研发热潮中,从一定程度上来说,美国基本形成了大数据研发全体动员的良好局面。

2.2 非营利性组织和教育机构积极利用大数据开展公共服务

美国的社区网络很发达,各类公共图书馆发展较快,行业协会等非营利机构的社会公共服务开展得如火如荼。大数据的兴起和发展给美国各类非营利性组织开展公共服务提供了良好的机遇,如“数据无边界运动”(Data without Borders Movement)通过收集大量的数据并加以分析,借助信息可视化技术为非营利性组织开展公益性的服务提供帮助。美国的高等院校已着手开始培育与大数据相关的高级人才,其中有些大学已开设与大数据相关的新课程[10],如密歇根州立大学、伊利诺伊州立大学、亚利桑那州立大学都已经开设了与大数据相关的课程和研究方向,特别是亚利桑那州立大学根据元数据、数据迁移等主题开设了数字馆藏课。

2.3 图书馆界积极响应,研究和尝试应用大数据

图书馆向来是新信息技术研究和应用的“重镇”之一。美国图书馆界积极响应,研究和尝试应用大数据。此前,美国的图书馆学研究者积极承担一些与数据相关的研究项目,如“语义网社区与关联开放数据运动”(Semantic Web Community and Linked Open Data Initiative)[11],约翰霍普金斯大学图书馆主持Data Conservancy项目、开发数据监护系统等[12]。美国的弗吉尼亚州立大学组建科学数据咨询小组,图书馆员充当咨询顾问的角色[13]。美国学者还对图书馆员在大数据时代中的角色与所需专业技能做了调研,认为“图书馆可以在大数据环境下承担数据管理职责”,同时也认识到目前绝大多数图书馆员不具备数据科学家必备的综合素质[14]。

美国图书馆界也做了将大数据应用于图书馆的尝试。美国哈佛大学图书馆已将“大数据”的服务引入图书馆中并付诸实践,将图书馆大数据向读者公布。这些数据共包含1200多万种资料,有书目数据、地图、手稿、音视频等,并在美国数字公共图书馆中提供下载服务[15]。这是一种具有创造性和挑战性的改进,使我们认识到,大数据可以帮助图书馆实现知识的扩展和满足用户的知识服务需求。美国的Hiptype公司应用大数据技术来分析读者使用电子书的阅读习惯和爱好,构建知识服务社区实体行为智能分析引擎,从而有针对性地开展服务,取得了较好的成效[16]。美国俄亥俄州经营电子书、有声读物的经销商OverDrive公司长期与较多各类型的图书馆合作,该公司于2012年4月发布第一辑《大数据报告》称,公司从图书馆中收集大量数据提供给出版商和其他有合作关系的图书馆,以供开放存取,这些数据主要有图书馆网站访问数据、电子书和数字有声读物的流通数据以及读者的图书需求数据等。除此之外,OverDrive公司也通过“Buy It Now”网上商店等渠道为图书馆提供其所不具备的书目记录,为读者开辟了发现新图书的途径[17]。OverDrive公司通过大数据技术进行数据分析后发现,图书馆的电子书借阅数据分析将会提高出版商和经销商图书的销售额,也会拓展图书馆的服务范围,从而取得“双赢”的效果。

3 对我国的有益借鉴——基于图书馆视角的分析

3.1 大数据与图书馆有“不解之缘”

美国政府和教育机构、民间团体、非营利组织等都比较重视大数据的研究和应用,积极利用大数据开展公益性的服务,基本形成了全民动员的格局。这一点给我们有益借鉴:我国应加快推进大数据的研发和应用,图书馆界也责无旁贷。首先应在思想观念上确立新的认识:数据是图书馆的“生命”,大数据与图书馆有“不解之缘”。图书馆界的职业宗旨在于“最大限度地促进人类知识的交流与利用”,自从图书馆诞生的那天起,便与信息和知识有着紧密的联系,而数据概念的外延与信息和知识的外延有交叉之处,联系密切。因此,数据是图书馆馆藏资源的重要组成部分,数据经过加工提炼可以转化为人类有用的知识。特别是随着现代信息技术和网络通讯技术的迅速发展,图书馆与外界的联系必然越来越紧密,产生的数据也越来越多,对大数据的研究和应用成为图书馆界的新业务之一。图书馆应用大数据技术对用户数据进行科学的分析,可以获得更深入、丰富、准确的用户;大数据应用可帮助图书馆洞察最新知识服务的趋势、快速准确地做出决策,抓住新的知识服务机遇[18]。

3.2 大数据促使图书馆服务方式发生变革

新信息技术的研究和应用常常把图书馆推向风口浪尖,大数据技术也不例外。大数据技术将为图书馆带来较深刻的影响和创造性的变化,对图书馆的知识服务能力和知识服务机制产生较大的冲击,可以帮助图书馆建立和完善新的知识服务方式。大数据时代的图书馆服务方式将发生一定的变革,服务途径、服务范围、手段等也将发生变化。大数据环境下,图书馆的服务策略建立在对大规模复杂数据搜集、组织整理、分析和挖掘的基础之上,因而大数据时代的图书馆服务项目更具有针对性和操作性,服务方式和途径等也将随着图书馆服务决策的调整而改变[19]。可以预言,大数据时代,以信息的处理与服务为优势的图书馆的服务范围和领域将会得到更大的扩展和延伸,数据分析服务、数据挖掘服务将成为图书馆知识服务体系创新的制高点。

3.3 我国图书馆应用大数据面临诸多压力和挑战

大数据为图书馆带来了良好的发展契机,但我国图书馆应用大数据仍面临诸多压力和挑战。首先是思想观念上,图书馆界研究和尝试应用大数据不可避免地会遭到质疑,图书馆员在面对一些“可能是机会的数据”时没有清醒的认识,缺乏将数据转换成有用知识的意识,对分析和管理图书馆的海量数据也没有一个清晰的方案。其次,大数据对图书馆的数据存贮能力和计算能力提出新的挑战。目前大多数图书馆的信息技术人才、数据分析技术和硬件基础设施等难以满足大数据的应用及用户的知识服务需求,数据量的迅速增加对支持非结构化数据存储及分析的图书馆硬件基础设施提出了更高的要求。第三,我国图书馆应用大数据还面临其他一些挑战,如:图书馆大数据的安全与隐私问题,大数据的集成、分析与能耗问题等[20],这些问题有待进一步的研究。

标签:;  ;  ;  

美国推广大数据的应用实践及其有益借鉴&从图书馆的角度分析_图书馆论文
下载Doc文档

猜你喜欢