面向用户的档案信息集成管理系统,本文主要内容关键词为:管理系统论文,档案论文,用户论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着互联网和信息技术的迅速发展,档案信息管理模式也在发生着变化。网络环境的开放性、动态性,使得档案信息资源种类不断增加,更新速度加快。面对海量的档案数据资源,用户要求获得更加方便、快捷、准确的档案信息服务。随着数字档案馆的建设和发展,档案馆从关注单个应用和单个资源的建设逐渐走向从集成的角度考虑架构层面和整体服务模式的问题;与此同时建立基于Web Service技术的面向用户的档案信息集成管理系统,促使档案馆的服务方式从传统的手工服务、自动化服务,逐步向数字化、集成化服务的方向发展。
1.面向用户的档案信息集成管理的内涵
档案信息集成管理是借助计算机技术和网络技术将档案信息资源中各种有关的档案信息资源、信息技术和档案信息机构的合作与档案用户集成在一起,进而提高档案信息的竞争力和适应力。档案信息集成管理是坚持以用户为中心的原则,是一个使用户满意,档案信息资源整合优化,经济高效和管理结构最大价值实现的过程。①
(1)档案信息资源的集成管理
档案信息资源的集成管理是档案信息管理的基础,也是实现档案信息集成服务的基础。档案信息资源集成是将档案信息资源各要素有机地链接成一个整体的动态过程,是对各种档案信息的重新整合。档案信息资源的管理是通过网络来收集内外部网络的这些档案信息,利用标准来规范网上的档案信息格式,管理网上档案信息的转换和提取,分析复杂的档案信息,理顺档案信息之间的逻辑关系,利用数据挖掘等技术提取有用的档案信息,利用可视化等技术为档案信息用户提供服务。
上海档案信息网就为档案用户提供视频栏目、馆藏历史、照片浏览等栏目,其中的视频栏目就为档案用户提供了《一号机密》、《追忆——档案里的故事》等影视经典②。这些电子文档都是经过筛选、整合、优化之后的档案信息精品服务。在档案集成信息服务中,为满足档案信息用户的精品服务,需要对档案信息资源进行精加工,具体面向用户的档案信息资源集成服务链见图1。由图1可知,面向用户的档案信息资源集成管理是为了充分发挥档案信息资源整合的最大效益。在企事业单位中,一个单位的各部门利用不同的软件系统完成日常的业务处理操作,产生各种档案信息源。为了收集这些档案信息,并将这些档案信息转化为档案,档案工作者必须坚持以用户为中心的原则,利用数据仓库等技术将这些档案信息自动地从不同业务系统提取出来,并转换和装载各种档案信息,从而保证将内部档案信息资源和外部档案信息资源进行有机融合,形成一个高效合理的数据集市。数据集市存放着为某组用户所定制的数据,通过数据集市可以按照某一主题将数据进行一定的整合服务,通过分析、报告、数据挖掘以及各种多维分析工具,通过可视化界面将其中隐藏的知识提供给特定的用户。③
图1 面向用户的档案信息资源集成管理
(2)档案信息技术的集成管理
档案信息技术的集成是档案信息集成管理的重要内容。随着计算机技术和网络技术的发展,使得档案信息服务技术上的集成不再是难题。档案信息技术的集成除了包括计算机技术、数据库技术、网络技术、数据挖掘等技术还包括智能代理技术、信息推送技术和网格技术的组合运用。这里笔者主要探讨集成检索技术、网格技术、智能代理技术等。
信息集成检索技术主要是运用于跨库检索、联邦检索、多数据库检索,是借助单一的检索接口,利用统一的检索方法,实现对分布式、异构信息资源的检索,信息资源经集成检索系统发现、获取、整合、包装处理后,形成统一的检索结果,并按用户定制的方式呈现出来。④集成检索的协议标准主要包括HTTP协议、可扩展标记语言XML、元数据标准、Z39.50信息检索协议、服务描述协议WSDL(Web Service Description Language)、UDDI统一发现描述集成(Universal Discovery Description Integration)、开放资源互操作协议OAI(Open Archive Initiative)、分布目录信息存取协议LDAP(Lightweight Directory Access Protocol)、简单对象访问协议SOAP(Simple Object Access Protocol)等;集成检索涉及的关键技术有动态数据交换技术、动态数据库访问技术、通用服务中间件技术、资源元数据获取技术、资源选择技术、检索式转换技术和结果整合技术等。⑤
网格技术(Grid)是构筑在互联网上的一组新兴技术,它将高速互联网、计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和服务。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格的功能则更多更强,它能让人们共享计算、存储和其他资源。所谓其他资源包括通信资源、软件资源、信息资源、知识资源等。网格最早是以集成异构计算平台的身份出现,接着跨入分布式海量数据处理领域,将在信息集成领域一展身手。Globus组织在Globus Tookit 2.0的基础上,结合Web Service技术提出了网格服务体系结构OGSA(Open Grid Services Architecture)规范。OGSA规范运用Web服务描述语言(Web Service Description Language,WSDL)达到了服务的自我描述、可发现性、协议的互操作性。因此信息网格就是要通过统一的信息交换架构和大量的中间件协议,向用户提供“信息随手可得”式的服务。⑥服务的实质使得由单一的服务构造更为复杂的服务成为可能。
智能代理技术具有代理性、适应性、智能性和协作性等特点。代理既能独立地完成自己的工作,又能与其他代理协作共同完成某项任务。而且代理能够接受控制并能感知环境的变化而影响环境。智能代理技术在解决复杂的、动态的、分布式智能应用方面显示了强大的优越性。智能代理技术能实现对信息资源的集成管理。智能代理技术能屏障服务资源的多样性、复杂的、分布性和异构性,特别是对网络信息资源,可以利用智能代理技术的智能搜索对网络信息进行搜索、分析、过滤、分级和集成,形成面向用户的信息资源体系。智能代理技术可以实现服务功能的集成,智能代理技术可以通过一站式服务为用户提供各种信息资源的集成服务。同时智能代理技术可以将本地的资源和服务与互联网上的资源和服务有机地融合,形成基于资源与服务重组的集成服务体系。
(3)档案信息机构的合作与档案用户集成管理
对档案信息机构而言,其内部档案信息是可以控制的,而外部档案信息资源却难以控制,因而需要档案机构间的协调和融合。对档案信息用户而言,其需求是多元化、个性化和综合化、集成化的服务,这样可以避免用户花大量的时间和精力寻找分散的信息。这就要求档案信息机构实现跨系统的资源重组与服务整合。目前档案信息机构为了方便用户查找资料,已实现了资源的初步整合。例如:由上海市档案局和档案馆所办的上海档案信息网上就整合了部分上海各区的档案信息,方便用户的快速查找。
2.面向用户的档案信息集成管理系统
随着档案机构信息化进程的不断推进,档案机构内部出现了越来越多的应用系统,包括独立或委托开发的各种MIS系统,在操作系统方面有UNIX、Solaris、Windows等不同的平台,硬件平台也呈现大型机、小型机、微机等并存。这些管理信息系统的开发在一定程度上提高了档案机构的信息化程度,但由于各个系统之间的相对独立性和差异性,同样也给档案机构的集成管理带来不少问题:①系统兼容性差,经常出现数据格式不统一、数据冗余度大、资源浪费等问题;②共享信息资源安全性低;③随着新系统的不断增加,新旧系统整合难度加大,实施成本加大,效率低;④数据没有实现整体管理,无法进行有效的数据分析和数据挖掘,不能提供全面的决策支持等。
随着计算机技术和网络技术的发展,以及可扩展标记语言XML作为一种标准的数据格式被广泛的接受,笔者提出基于Web Service技术的面向用户的档案信息集成管理系统(图2)。由于Web Service技术建立在标准性与开放性基础之上,使用不同语言开发、运行在不同平台上的档案用户可以无缝的获取所需的资源,达到资源效率的最大化。
基于Web Service技术的档案信息集成管理系统分为三层体系结构(图2):即用户界面层、集成服务层、资源整合层。其中资源整合层是构成档案信息集成管理系统的基础,集成服务层是实现档案信息集成服务的窗口,这两部分是档案信息集成管理系统的核心部分。
图2 面向用户的档案信息集成管理系统
(1)用户界面层主要是根据用户使用的设备特性进行档案信息的转换。通过UDDI这一分布式Web服务的信息注册规范描述了Web服务,同时也定义了一种编程接口,这种编程接口提供了描述各种Web服务的简单框架,用来定义基于SOAP的注册和发现Web服务的标准。UDDI真正实现了Web Service信息访问的“一次注册,到处发布”,它把Web服务与档案信息用户联系起来,起中介作用。对档案信息系统集成与互操作影响较大的协议还有元数据标准、Z39.50、WSDL、OAI、LDAP、SOAP等。通过这些协议实现了对分布式、异构档案信息资源的统一检索。
(2)集成服务层通过搜索引擎子系统、用户管理子系统、个性化子系统、资源配置子系统等系统来提供档案信息集成服务。搜索引擎子系统采用分布式异构访问技术和知识库技术,集成多种数据源驱动,可访问任何一种XML、ODL、Z39.50以及关系型数据;搜索引擎子系统是提供给档案用户的主界面也就是以机构用户身份登录后的检索界面。用户管理子系统实现查找用户、创建用户、黑名单列表等功能。个性化子系统是通过用户以用户名、密码方式登录来为档案信息用户提供个性化服务。资源配置子系统配置知识库提供大多数数据资源的配置信息,用户“按需索求”,在线自动更新资源配置信息,确保资源的有效访问。资源配置子系统的作用是将档案机构本系统的各种资源添加到统一检索系统中,从而实现一站式检索服务,为用户提供统一的检索界面和统一的检索语言,使用户可同时检索分布于本地和异地的各种异构资源。数据源配置工具基于网页元数据抽取技术和ODL(Object Definition Language)、Z39.50协议的资源配置技术。
(3)资源整合层主要应用各种整合与资源组织管理技术对档案机构已有的资源进行整合并构成各种数据库和数据仓库。资源整合层的资源类型丰富,有Web资源、关系数据库、元数据联合仓库、其他各种类型的电子文档、文摘索引以及各种馆藏资源。
总之,面向用户的档案信息集成管理系统能够为档案信息用户提供以下服务:多种异构档案数字资源系统的联邦检索服务;对各种档案数字资源元数据联合仓库的跨库检索服务;对档案用户提供个性化的检索服务;通过档案资源调度等与其他应用系统无缝集成来为用户提供更多服务。
3.建立面向用户的档案信息集成管理系统的原则
基于Web Service技术的面向用户的档案信息集成管理系统是科学、规范的,通过这个平台能够将异构、分布式的档案信息资源整合起来,让档案信息用户利用各种档案信息资源。因此,面向用户的档案信息集成管理系统应坚持以下原则:
(1)用户中心原则
面向用户的档案信息资源集成管理最终的目标是为了实现档案信息用户的信息满足,帮助档案信息用户快速而简单地进行检索,因此档案信息资源集成管理系统应特别重视用户的体验。将以用户为中心的设计思想贯穿到档案信息资源的集成管理、信息技术的集成管理、档案信息用户的集成管理各个环节。在用户为中心的思想指导下分析档案信息用户的现状和用户需求,根据用户的需求进行档案信息集成系统的开发,建立用户的数据模型,根据数据模型来进行系统设计,最后根据用户的反馈意见来进行系统测试评估,以求进一步完善。
(2)实施标准原则
面向用户的档案信息集成管理系统建立的目的就是为了实现对分布式、异构档案信息资源的统一检索,并按用户定制的方式呈现出来。这样,制定档案信息资源集成和服务标准,保证档案信息揭示的统一性,从而方便用户集成和共享来源于不同的档案信息就显得尤为重要。档案信息资源和技术集成管理的标准主要包括:数据存储格式的标准化、数据著录格式的标准化、标引与描述语言的标准化、开放接口的标准化、安全保障技术的标准化、通讯协议的标准化、数据管理软、硬件的标准化等。
(3)整体优化原则
档案信息资源集成管理系统的整体优化包括:档案信息资源的集成优化、档案信息技术的集成优化和为档案信息机构和用户服务的集成优化。就档案信息资源而论,通过信息资源的集成管理,把原来各自独立的信息单元融合成一个有机的不可分割的整体。从整个档案信息服务体系来讲,确保档案信息资源不受系统、部门的限制,实现全局系统的优化。经过优化整合的档案机构和其他信息服务机构在技术上能为用户提供统一的用户界面和服务平台使集成后的各类信息具有统一性和有机关联性,体现了档案信息资源和档案信息用户匹配的系统性。
(4)适度发展原则
信息技术和网络技术的发展很快,面向用户的档案信息集成管理系统的建立应从各个角度考虑技术发展而带来的管理滞后问题,管理规划和系统设计更应该考虑到技术发展和更新问题。另一方面,档案集成管理的服务平台应该有可扩展性,如支持档案信息用户的教育,使用户能够与时俱进地适应系统的更新;支持档案资源共享与机构的业务合作;系统安全和系统管理等。这种可扩展性既取决于用户的信息需求,又依托于档案机构的信息服务系统功能的扩展。
注释:
①何军:《档案信息的集成管理与集成服务模式研究》[J],《档案学通讯》,2006(2)。
②http://www.archives.sh.cn/(2007-7-8)。
③胡昌平:《面向用户的资源整合与服务平台建设战略》[J],《中国图书馆学报》,2005(2)。
④Michael Goedicke.Service Integration.In:W.Emmerich and S[J].Tai(Eds.):Springer-Verlag,2001。
⑤黄如花、陈朋:《基于网络的集成化信息检索》[J],《中国图书馆学报》,2005(1)。
⑥Zheng Feng,etc.Research on Integrating Service in Grid Portal.In:M.Li et al.(Eds.)[J].Springer-Verlag2004。