基于大数据的数字档案馆信息服务模型构建,本文主要内容关键词为:档案馆论文,信息服务论文,模型论文,数字论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数字档案馆建设正经历着从资源主导向服务导向转变,利用先进的信息技术和理念,构建高效、快捷、便利的数字档案馆信息服务平台,为用户提供精品化、多元化、个性化的信息服务,已成为当前数字档案馆建设的重要内容。大数据为未来档案馆实现信息服务内容的丰富、信息服务手段的完善、信息服务模式的突破等提供了新的思路和解决方案。因此,构建一个基于大数据的数字档案馆信息服务模型具有非常重要的理论与现实意义。 一、需求分析 需求分析是信息系统开发中最基础的工作。信息服务的主要参与者一般为信息服务者与信息用户,因此需求分析也主要围绕两者展开,分为业务需求与用户需求。 (一)业务需求 业务需求从总体上描述了为什么要开发系统(Why),组织希望达到的目标。基于大数据的数字档案馆信息服务系统模型的业务需求如下: 1.数字档案资源建设。资源建设是信息服务的前提与基础,当前数字档案信息服务大多是围绕现有的信息资源展开,通过构建基于大数据的数字档案馆信息服务系统,实现资源类型多元化、获取渠道多样化、资源描述标准化、资源组织专业化、资源保存完善化,从而真正建立覆盖人民群众的档案资源体系和利用服务体系。 2.数字档案资源开放。透明、参与、合作是开放社会的核心要素,因此对信息资源“最后归宿”的档案馆而言,开放必将成为数字档案馆的发展之路。以大数据信息服务系统为平台,通过数字档案资源开放,一方面确保社会公众有效获取及再利用数字档案资源的权利;另一方面形成数据扩散,为社会发展、创新及转型提供资源和动力。 3.数字档案资源开发。“档案部门的工作就是让沉睡的档案醒过来,让醒过来的档案站起来,让站起来的档案走出去”,[1]通过构建基于大数据的数字档案馆信息服务系统,实现档案资源的互联互通和深入挖掘,从而将“死档案”变成“活资源”,将“信息仓库”变成“知识海洋”,将“资源密集型服务”变成“知识密集型服务”。 (二)用户需求 用户需求必须能够体现系统将给用户带来的业务价值,也就是说用户需求描述了用户能使用系统来做什么(What)。研究表明,系统用户最终参与的有效性被认为是影响系统成败的最主要因素,[2]只有在充分了解用户需求的基础上,才能进一步对数字档案馆信息服务系统进行系统规划、分析与设计,进而开发出满足用户需求的服务系统。 1.信息检索。“信息过载”时代,“信息迷航”加剧,在这种数据密集型范式下,准确、快速地发现资源至关重要。能否在大量数字档案资源中快速而准确地找到所需信息,能否智能化、人性化地满足用户的检索需求,将是影响用户继续选择信息服务的关键。 2.知识挖掘。大数据背景下,用户对档案资源的利用程度不断加深,通过数据挖掘和文本挖掘,深层次发掘档案之间的关联,将分散在本领域及相关领域的结构化、半结构化、非结构化数据资源予以深度开发并通过智能化处理平台进行主动推送。 3.决策参考。如果数据被赋予背景,它就成了信息;如果数据能够提炼出规律,它就是知识;如果数据能够借助于各种各样的工具在分析的基础之上为我们提供正确的决策,它就是资源。[3]通过提供基于海量分布式资源的精细化知识组织输出,实现信息+解决方案的“一站式”服务,从而提高用户的科学决策水平。 4.数据展现。对用户而言,总是希望以易于理解的方式来接受服务,而不是一堆生硬抽象的数据,这就需要系统能够对服务结果作出解释并通过可视化手段予以展现,从而提供一个方便易用的知识环境,方便用户在大规模及复杂数据内容的基础上进行有效的理解、推理和决策。 5.用户参与。广大用户的参与,不仅使数据资源质量和信息服务效果得到有效监控,而且为服务系统的持续提供了强大的动力。通过数据资源的分享机制、定制机制、交流机制、个性化参与机制,实现数据服务由静态向动态转变,由单向向双向互动转变。[4] 二、功能设计 从结构上看,基于大数据的数字档案馆信息服务系统应该是多层次的。处于核心层的是决策支持功能,通过“数据驱动决策”实现信息服务需求满足;处于核心层外围的是支撑层,包括快速检索、深度分析、深层交互、跟踪反馈、安全保障等功能,从而保障核心功能的实现;最外围的是表现层,包括智慧服务、趋势预测、精准营销、自动推送、信息可视化等功能,是核心功能的拓展,也是支撑功能的具化,[5]如图1所示。
![](/public/uploads/article/2019/12/19/0362bac2057a42015e59ccb0.jpg)
图1 基于大数据的数字档案馆信息服务系统功能图 (一)核心层功能 基于大数据的数字档案馆信息服务核心理念是基于海量分布式资源的精细化知识组织输出,实现信息+解决方案的“一站式”智慧服务。就其本质而言,是一项以决策信息保障为中心的信息服务。因此,基于大数据的数字档案馆信息服务系统的核心功能就是通过提供客观化、知识化、个性化、嵌入化的产品和服务,来辅助用户决策的。 大数据时代是弘扬理性精神的时代,决策行为将日益基于数据分析,而不像过去更多地依赖于经验甚至直觉。“基于数据驱动的决策方法,政府将更加有效率、更加开放、更加负责,引导政府前进的将是基于实证的事实,而不是意识形态,也不是利益集团在政府决策过程中施加的影响”。[6]因此,数字档案馆信息服务必须提升从数据到决策的能力。一方面通过对海量资源的分析,从中帮助用户解决问题并提供决策支持;另一方面,将数据驱动决策融入到数字档案馆信息服务的各环节中,保证决策环节的准确性与自适应性,实现由数据优势到决策优势的转化。 (二)支撑层功能 支撑层是信息服务系统的中间层,以保障核心层与表现层功能的实现,基于大数据的数字档案馆信息服务系统支撑层,其功能主要包括:(1)快速检索,即在异构、分布的海量资源中实现信息的快速、准确获取;(2)深度分析,通过对结构化、非结构化数据中“档案馆——用户”关系进行深度挖掘,提供用户所需服务并分析预测未来需求;(3)深度交互,即在泛在、互联的环境下推动用户需求的智能感知和档案资源的即时处理、即时分析、即时响应,实现用户需求与档案资源之间的双向理想控制;(4)跟踪反馈,持续关注服务质量和用户需求,对用户行为状态、行为内容、行为习惯进行有效跟踪并及时反馈,提升服务品质和用户忠诚度;(5)安全保障,运用相关技术与模型提前发现系统风险,使信息安全防护由被动的事中评估、事后处置模式转变为主动的事前自动评估预测和应急处理模式。 (三)表现层功能 表现层是核心层与支撑层的外化和具化,是基于大数据的数字档案馆信息服务系统服务的具体表现,其主要功能包括:(1)智慧服务,通过对海量数据的收集处理,从中获得知识并提升能力,构建一个充满智慧的数据管理、数据服务和数据创新时代;(2)精准营销,通过用户定位、群体细分、行为分析、情绪分析等手段,精准掌握用户需求,开展个性化营销服务,更好地满足用户需求;(3)趋势预测,通过对海量资源的分析,档案馆不仅能满足用户当前需求,更可以预测和分析将来会发生什么,从而更好地改进自身服务及应对未来挑战;(4)自动推送,通过精准感知用户需求,将有效组织的信息和服务主动推送给用户,提高档案馆对用户需求的响应能力,促使档案馆由数据被索取者向服务提供者转变;(5)信息可视化,采用相关的分析模型,将数据之间的逻辑关系和语义关系以可视化的方式呈现,为用户提供生动、易用的知识服务环境。 三、系统架构 作为一项系统工程,基于大数据的数字档案馆信息服务是信息服务全生命周期活动中用户、技术、资源等的有机集成和优化,涉及数据生成、采集、传输、处理、分析、应用等阶段。结合系统及用户需求、系统功能及运行流程,笔者设计了一种基于大数据的数字档案馆信息服务平台构建体系架构,如图2所示:
![](/public/uploads/article/2019/12/19/62ab1d3edea9b4c54013ad79.jpg)
图2 基于大数据的数字档案馆信息服务系统架构 (一)物理层 物理层处于该信息服务架构的最底层,用于布置基本的网络环境,包括服务器、存储器、网络互联设备等,是该信息服务系统的后台,也是保证各部分正常运行的必备模块。大数据时代的到来,对计算机存储与计算的要求越来越高,因利用云计算的“基础设施即服务”(IaaS)来构建基于大数据的数字档案馆的存储及数据中心的应用环境,对资源层的海量数据进行存储和计算,可以更好地为用户提供各种服务。 (二)数据层 数据层是该服务架构的数据中心,用于构建和整合基于大数据的数字档案馆信息服务全生命周期管理过程中的各种数据资源。大数据时代,数字档案馆的数据资源主要由三方面构成:一是数字档案馆馆藏,主要源于纸质档案数字化及电子文件的接收进馆。这是数字档案馆信息服务的主体。随着档案信息化的发展,分散异构的数字档案馆将走向互联互通的数字档案馆群,数字档案馆将成为社会上最为重要的数据中心之一。二是网络信息资源,尤其是电子邮件、社交媒体、网页等价值重大、形式多样的数据资源,可借助大数据技术强大的检索能力,使之成为数字档案馆的“移动馆藏”,为用户提供多元化、人性化的“一站式”信息服务。此外,还有一种数据资源即用户数据,长期未得到重视和有效挖掘。通过对用户自身特征、不同偏好、习惯模式等分析与挖掘,创建满足用户需求的个性化信息环境,数字档案馆将极大地提升自身的服务层次。 (三)平台层 平台层是该服务架构的处理中心,用于对数据资源进行快速高效的数据处理,是数字档案馆信息服务的前提和基础。依据数据流转规律,结合数据处理需求,以提供大数据集的组织、分析、决策、展现等功能。数据组织,即数据的有序化与优质化,主要依据数据生命周期理论,对元数据进行管理并通过数据清洗、数据集成、数据监护等手段来保证数据的质量与安全;数据分析则是通过对相关数据集中结构化、半结构化、非结构化数据进行常规、广度、深度分析,形成不同纬度、不同粒度、不同功能及不同类型的数据子集,最大限度地了解用户需求及数据内容;建立在相关关系基础上的预测是大数据的核心,通过对分析结果中用户需求与数据资源的匹配,能够对当前的管理及未来的发展作出有效决策并通过决策反馈分析实现决策效果的优化;数据展现则是信息服务后台处理的最后环节,通过对数据处理结果进行解释并进行可视化,实现对处理结果的理解。 (四)服务层 服务层处于该服务架构中的最高层,是基于大数据的数字档案馆信息服务内容的集中展示层,因此是整个系统中最重要的一层。用户通过Web接入数字档案馆信息服务系统后,服务器对用户需求进行分析并匹配信息服务平台所提供的各种服务。在数据组织的基础上,建立“一站式”资源服务平台或数字资源社区,为用户提供快捷、简单、易用的资源发现及获取服务。在这种由档案资源、用户、专家构成的开放性、创新性的社区环境下,利用群体智慧为特定用户提供信息服务的众包服务将日益重要。在数据分析的基础上,数字档案馆不仅提供基于海量分布式资源的精细化知识组织输出,即实现信息+解决方案的“一揽子”服务,不仅获得知识,更重要的是基于信息服务全生命周期对用户需求及服务质量进行持续关注,开展关联服务、跟踪服务、宣传推广服务,全面提升数字档案馆服务品质和用户忠诚度。基于大数据分析、预测及智能服务决策技术建立各种模型,不仅能够有效了解用户需求、科学预测未来发展趋势,还能对数字档案馆信息服务进行危机预警及风险预测,以应对未来生存危机。信息可视化则是通过从抽象数据到可视化结构的映射来帮助用户“在大规模及复杂内容的基础上进行有效的理解、推理和决策”。[7]从当前来看,信息可视化主要是一个辅助手段,而未来则将会成为一项重要的服务内容。在信息服务的过程中,难免会出现一些偏差,而通过基于大数据分析的服务反馈,将使数字档案馆信息服务始终保持活力、畅通。 大数据时代的到来,为数字档案馆信息服务的发展提供了契机,实现了从传统信息服务向知识服务及智慧服务的转变。基于此,笔者构建了一个基于大数据的数字档案馆信息服务模型,力图推动数字档案馆信息服务朝着服务个性化、决策智能化、推送主动化、响应敏捷化的智慧服务转型。然而,基于大数据的数字档案馆信息服务模型是一项系统工程,涉及数据管理水平、数据处理技术及数据服务创新等方面,因此其具体效果还有待实践的检验,有待我们的进一步努力。
标签:大数据论文; 用户需求分析论文; 功能分析论文; 用户分析论文; 决策能力论文; 云计算论文;
基于大数据的数字档案信息服务模型的构建_大数据论文
下载Doc文档