大数据环境下数字图书馆发展探究论文_马梦丹 周宁馨

大数据环境下数字图书馆发展探究论文_马梦丹 周宁馨

(云南大学历史与档案学院,云南 650000)

摘要:大数据的出现及发展趋势对数字图书馆的发展产生重要的影响。本文在分析大数据的特点及其与数字图书馆关联基础上,指出对数字图书馆资源组织、服务、安全管理、知识产权带来的挑战,并就推动大数据环境下我国数字图书馆建设提出战略性建议:优化资源组织、存储方式,提供新型服务模式,实施安全防范策略,规避知识产权风险等。

关键词:大数据;数字图书馆;对策建议

一、大数据

2011年,麦肯锡公司发布了《Big Data:the Next Frontier for Innovation》,在该报告中首次引入了“大数据”这个概念,随之引起各行各业对大数据的研究热潮,信息科学和图书情报界普遍关注、常谈常新,成为最吸引人眼球的话题。

大数据(Big Data),指无法在一定范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率、多样化的信息资产。大数据有四大特点:数据容量大(Volume)、数据类型多(Variety)、商业价值高(Value)和处理速度快(Velocity)。其数据规模和转输速度要求极高,结构不适合原本的数据库系统。通俗来讲,大数据技术就是基于分析处理(移动)互联网、信息领域日常运作中累积下来的海量数字信息资料,从而来发现和形成新的服务形式的技术。

二、大数据与数字图书馆

大数据是数字图书馆中海量数据的一个发展。大数据与图书馆相同之处在于都涉及海量的数据,不同之处在于大数据比海量数据结构更复杂、价值密度略低、开大难度更大、使用价值更大。在数字图书馆建设过程中, 大数据问题是不可回避的, 图书馆作为信息服务平台, 必须深入了解大数据的特征、技术、应用。科学研究的不断变化转型对数字图书馆的大数据利用提出了新的要求。大数据的出现给数字图书馆资源建设、用户服务、安全管理等带来了机遇与挑战。

三、大数据环境下数字图书馆资源建设

目前,数字图书馆保存更多的是结构化数据,非结构数据处于象牙塔中。我国数字图书馆虽实现了信息资源和馆藏的数字化,音视频等多媒体信息的转换存储和检索,构建各种类型的数据库,达到了数字图书馆建设的初级阶段。然而面对迅速发展的计算机和网络通讯技术,我国数字图书馆发展出现资源建设结构不合理,资源同质化现象严重等问题。据统计,当今世界结构化数据增长率约为32%,而非结构化数据增长率则是63%,至2012年,非结构化数据占有比例已达到互联网整个数据量的75%以上。[ ]从数据中可以发现, 结构化数据仅为大数据的一小部分, 非结构化数据已为人们生活所依赖, 更具持续性价值。非结构化数据的缺乏使数字图书馆很难融入企业、个人等用户群体的细节服务。

在大数据时代背景下,我国数字图书馆需转变信息资源建设观念, 改进资源的选择、整合与保存方式。大数据的数据驱动时数字图书馆资源的组织结构发生巨大变化,数据化、语义化、碎片化和关联化的资源建构需求尤为突出。数字图书馆系统所拥有的任何资源都可以被视为某种格式的“数据”,都可以被表征、解析、链接等一系列加工和组织,逐步实现其数据化和知识元化的解构、重组与关联,形成新的资源空间。大数据环境下,图书馆没必要也不可能将全部馆藏资源数字化,但必须优先对在某一方面形成了一定规模的、结构比较完整的文献资源,有系统、有组织地进行开发整理,以真正发挥数字图书馆的规模效益。例如美国国会图书馆的“美国记忆”项目,收集整理了照片、手稿、海报、乐谱、等记载美国历史文化的特藏。无论是要开发原生数字资源还是特色资源, 都要时刻关注这些数字资源的长期保存的标准问题、存储介质的选择问题、多重备份与适时迁移问题等一系列问题。

期刊文章分类查询,尽在期刊图书馆此外,图书馆要开拓思路,要将一些政府信息、社会关注信息、网络热点信息囊括其中,更需要将用户使用数字图书馆、搜索网络的行为信息作为数字图书馆的采集资源。

四、大数据环境下数字图书馆服务

在传统的数字图书馆服务环境中, 用户最关心的是:解决信息有和无的问题;大数据环境下, 用户对数字图书馆服务价值的期望是解决信息粗与精的问题。人们关注的不再是信息传递的形式,而是传递的内容和对象。未来的任务主要不是获取越来越多的信息,而是信息的去冗分类、去粗取精,从信息中挖掘知识。数字图书馆服务能否从以往粗放型转变至精准型,促进发现对象由文献单元向知识单元的细粒度转变,为用户提供具有数据挖掘分析、关联发现和可视化展示功能的知识发现系统,实现从文献资源发现向知识发现的转变,是建设数字图书馆必须面对的最重要问题。

大数据环境下的数字图书馆服务具有数字化、便捷化、高效化的特征。具体地讲,大数据环境下的数字图书馆服务,既包括基础性服务(传统服务),也包括个性化服务(数据可视化等)、创新化服务(MOOC等)和智慧服务。首先,数字图书馆提供一站式的资源服务平台。一站式资源服务平台建立在大数据集成基础之上,将各种数据开发、分类整理,并根据用户需要进行组织控制与分类设置,最后通过相关渠道进行传递。其次,信息与资源的可视化服务。可视化服务平台在数字图书馆的应用较为普遍,其利用二维法与三维法构建信息可视化空间,可以实现多维信息的可视化,比如建立可视化图谱、可视化信息检索方式等。再者,基于大数据的学科知识服务。馆员要懂得利用大数据相关技术进行知识挖掘与共享传递,能够将大数据环境下相关主题知识进行有效整合,及时推荐给用户,并且根据用户需求进行改进。

五、大数据环境下数字图书馆安全问题

大数据时代,图书馆数据量是级数非线性增长的,大数据环境呈现海量、高速、多样和高价值的特点。导致数据中心系统复杂度和数据管理、存储难度增大, 大数据平台已成为黑客攻击的重要目标。黑客通过对获取的大数据资源进行分析,可明确图书馆的系统运营特点、用户服务模式和安全防范措施,能够基于大数据决策支持向图书馆发起精确的攻击。此外,虚拟化、云计算、社交媒体、移动阅读终端设备和其他新兴技术的使用,大幅度增加了外部数据的信息接入点。

面对大数据的冲击,要利用其增强数字图书馆的安全防御能力。首先图书馆在利用大数据技术保护系统与服务安全时,不能仅仅将安全防范重点放在恶意事件的发现上,而且还应通过对监控设备采集的大数据安全资源综合分析,明确恶意攻击的来源、方式、指标参数和危害程度。其次,安全管理大数据平台的构建中,在不大幅度增加平台系统复杂度和建设成本的前提下,应尽量使用一些技术成熟、兼容性强和可扩展的数据包捕捉与分析工具,速实现数据的完全采集、数据集快速定位、科学分析和准确决策。再次,安全数据仓库在开发中, 应加强数据仓库对诸如监控日志、工作日志、欺诈警报等, 来自不同采集对象和结构类型数据的管控效率。

结语

大数据开启了数字图书馆的一次重大时代转型,在数字资源建设、新型服务功能、安全管理和知识产权等方面都会出现巨大的改变,一个崭新的数字图书馆将会出现在面前。

参考文献

[1]大数据[EB/OL].[2018-06-04].https://baike.sogou.com/v59756418.htm?fromTitle=大数据

[2]霍娜.非结构化数据来袭[EB/OL].[2013-12-19].http://www2.ciw.com.cn/h/2562/375443-17627.html.

[3]曾湘琼.试论制约数字信息长期保存的软瓶颈[J].图书馆学研究,2005(12):56-58.

作者简介:马梦丹(1994年—),女,汉族,江苏苏州人,硕士在读,单位为云南大学历史与档案学院,研究方向为图书馆管理、信息服务;

周宁馨(1993年—),女,汉族,浙江温州人,硕士在读,单位为云南大学历史与档案学院,研究方向为图书馆管理。

论文作者:马梦丹 周宁馨

论文发表刊物:《知识-力量》2018年8月下

论文发表时间:2018/7/30

标签:;  ;  ;  ;  ;  ;  ;  ;  

大数据环境下数字图书馆发展探究论文_马梦丹 周宁馨
下载Doc文档

猜你喜欢