档案网站信息资源整合现状及分析——以江苏省地市级综合档案馆为例,本文主要内容关键词为:江苏省论文,档案馆论文,为例论文,市级论文,资源整合论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
档案网站信息资源整合是指根据档案用户的利用需求,结合档案网站信息资源的特点,利用先进的技术,按照一定的原则、规范及标准,实现一定范围内的档案网站信息资源的抓取与优化,并组织成一个集关联性、动态性和实用性于一体的有机整体或统一的利用平台。整合是为用户方便、快捷地获取所需档案信息而服务的,整合的资源、方法、利用形式等都会对用户的使用产生影响。本文通过重点调查的方式,拟对国内档案网站信息资源整合的现状作出一个比较全面的了解。
一、档案网站信息资源整合现状
对综合档案网站信息资源整合现状的统计分析基于“江苏省地市级档案网站信息资源及其整合后台调查”,其主要依据是《江苏省地市级档案网站信息资源及其整合后台调查表》。调查表将档案网站信息资源分成馆藏数字化档案、现行文件、特色档案、编研成果四大类进行分别调查。本次调查以江苏省13个地市级综合档案馆为调查对象(如表1所示),问卷共发放13张,回收11张,样本总量为11。
1.整合对象
表1的统计数据表明,除有2家档案网站完全没有进行资源整合,1家档案网站整合正在建设中外,实际进行信息资源整合的档案网站共8家,比例达到了72.7%。说明在全国档案信息化的大趋势下,各档案馆已经开始意识到资源整合的必要性,并进行了初步尝试。
在上述8家进行资源整合的档案馆中,只有4家档案馆对四类档案信息资源都进行了整合,其余档案馆只对部分信息资源进行了整合,其中绝大多数的整合都是针对馆藏数字化档案和现行文件这两种资源形式的,比例都达到了87.6%,特色档案的整合比例也不小,达到了62.5%,编研成果的整合力度则稍显弱。这是有原因的:首先,相对其他资源,编研成果的利用群较小;其次,由于目前的整合多是针对本馆内部资源的整合,而单个馆藏的编研成果数量实际并不多,需要整合资源太少,从投入与产出考虑,整合意义不是很大。
由表2可以看出,档案网站信息资源的整合范围比较狭窄,绝大多数档案馆只限于本馆馆藏内部资源的整合,尤其是特色档案和编研成果的整合,基本不涉及到与馆藏以外的整合,仅有1家档案馆对特色资源进行了与其他单位的整合。特色档案与编研成果的单个馆藏资源数量本来就不多,选择单个馆藏独立整合的方式从经济效益上讲并不可取,因而可选择与馆藏其他资源进行共同整合,也可选择与其他档案馆馆藏特色资源或编研资源进行共同整合。而后者的整合,可发挥经济效益的最大化,同时也能充分体现出这两种资源的特色,为用户利用提供方便,但也正是这种整合对于资源的特征要求比较高,对整合“合作馆”的选择也要更加挑剔,相对来说,这种整合从方案、体制的确定上都不能轻易入手。因而,在现阶段,这两种资源的整合范围还比较狭窄,有其特殊原因。至于现行文件的整合,由于与电子政务的建设紧密相关,有2家档案馆进行了与下属单位的整合。至于馆藏数字化档案的整合,其范围虽然相对较丰富,但仍集中在微观整合上,其他范围的整合比例仅达14.3%。
2.整合方法
网站信息资源的整合方法主要有四种,即中间件技术跨库整合方法、元数据库方法、实体仓库方法、信息抽取方法①。
由表3可以看出,在整合方法的使用上,方法的选择较单一,中间件技术跨库整合与建立实体仓库成为主流的整合方法,而建立元数据库和信息抽取的方法则不常使用,这与技术的成熟度相关。建立元数据库首先要制定好相应的元数据标准,而元数据标准的建立这一实践活动在我国仍处于理论研究阶段,国内档案馆对元数据库的建立的实践则更加少。
在对馆藏数字化档案进行整合时,目前多采用中间件技术跨库整合,而对现行文件整合时,则多采用实体仓库技术。虽然就资源特征来说,这两种方法的选择还欠考虑,但在整合方法选择上,实际上,各档案馆已经开始考虑选择适合本馆资源整合的技术了。
实体仓库方法在技术层面上说比较简单,人工输入的任务较繁重,因而适合数据资源比较少的整合,从方法的选择中也可以看出,档案网站资源整合的数据量较少,整合层次偏低。
3.整合结果表现形式
在整合结果的表现形式上,网站整合基本上都使用了检索窗样式,这是数据库形成后给用户提供利用较为简便的方式。对于目录树样式,绝大多数档案馆已经意识到其对于用户检索的辅助功能,但由于馆藏数字化档案或现行文件的数量比较庞杂,这一工作对人力单薄的档案馆来说显得比较繁重,因而部分档案网站未使用这一方法。另外,对于特色档案、编研成果来说,由于数量相对较少,使用目录树样式其实更利于表现其展示、宣传的功能特征。
4.四类主要档案信息资源的整合现状
下面分述四类主要档案信息资源的整合情况:
(1)馆藏数字化档案
较其他三类信息资源来说,馆藏数字化档案整合范围比较丰富,方法选择上、结果表现形式上也比较多样。不足之处是整合仍集中在本馆内部的资源整合,且这种合作式的整合规模较小。同时,由于馆藏数字化档案的数据库分布并不是很广,数据也并不需要经常更新,因而中间件技术跨库整合这一技术的选择并没有体现出资源特色,因为这一技术主要适用于拥有多个分布式数据库且数据经常更新的检索平台。
(2)现行文件
现行文件数据增长迅速,分布广泛,更新快,是亟须整合的数据类型。然而,目前现行文件整合的范围很窄,除了本馆内部、与档案馆下属单位的现行文件整合外,其他整合范围都没有涉及。在技术选择上,也有失偏颇:对于利用数据库形式组织的现行文件来说,目前各馆藏的数量并不多,但是其增长迅速、更新快,采用建立实体仓库的方式进行整合,不利于数据的及时更新;对于文件、网页等非结构化的现行文件资源,即使利用实体仓库的方法建立查询数据库,也可以另外再加入到中间件技术软件的检索数据库列表中,以实现一体化的自动查询。
(3)特色档案
特色档案的整合大多是本馆内部的整合,因而大多是馆藏特色档案的汇总,而不能具体表现某种特色,如对某一区域的地方特色档案的整合,或对某一专题(如明清档案)的特色档案的整合。由于大多是微观整合,目前特色档案不能形成体系,不能起到参考咨询作用,因而主要功能还在于展现本馆特色,为用户提供文化娱乐、历史教育,或为本馆馆藏进行宣传等。但若从特色档案的这一功能上考虑,其目前的组织方式也是欠考虑的,利用检索窗样式其实并不如目录树样式符合功能需求。
(4)编研成果
编研成果的整合是整个档案信息资源整合体系中最弱的一环,就课题组目前所了解的编研成果整合往往是本馆编研成果目录的罗列,一般不提供专业的检索工具,而通过网站自身的站内检索进行查询,并未形成完整的数据库组织体系以及便利的信息检索与导航系统。
二、档案网站整合中存在的问题
从上述分析中可以看出,尽管近年来,我国档案网站信息资源建设已经初具规模,信息资源总量逐年增长,档案文献数据库的建设也在不断加强,但我国档案网站信息资源整合的现状,应该说还远远落后于公众对档案网站信息资源整合的要求,存在很多不足。下面就调查中存在的问题进行一一阐述。
1.整合层次较低
纵观上面的调查数据和实际现实,不难发现,目前,档案网站信息资源整合的层次还是比较低的,其整合还是以微观整合、馆藏资源整合为主,且服务方式单一化。
档案网站资源建设孤立封闭,使得信息资源建设与服务主要以本馆馆藏为主,而不以资源特点、用户需求为主,档案信息资源不能得到有效共享,整合层次低而由此产生一个个“信息孤岛”,当用户面临信息需求而求救于如此零散、孤僻的“信息群岛”时,自然是无从下手去寻找资源。
2.整合资源单一
纵观我国的档案网站整合资源无论从内容还是形式上都显得不够深入和丰富,整合资源多是馆藏数字化档案和现行文件,单一化很明显。档案网站信息资源的范围,除了我们所说的馆藏数字化资源、现行文件、特色档案、编研成果这些大概念外,还可以继续扩散下去,如馆藏数字化档案中的明清档案、革命历史档案等等,现行文件中的规范性文件、经济类文件等等,特色档案中的家谱资源、地方志资源、名人全宗等等,编研成果中的大事记、史料汇编等等,此外,其他相关的档案出版物和资料信息等也是档案网站信息资源的重要组成部分。
3.重资源建设,轻资源利用
这表现在:在资源整合技术的选择上,并没有针对资源自身的特点来进行分析,可见其资源建设只讲速度,不讲究合理性;数据库建立后就不再更新或者更新不及时,存在无人维护的情况;各档案网站数据库检索平台的设置上,检索项太单一,目录式样式又没能全面使用,因而不能满足用户需求的多样化;信息服务观念落后,除了提供数据库检索和导航服务,尚无其他个性化服务等等。目前档案网站整合的利用服务,不能满足各种用户需求,而往往用户群的缺失也导致了档案网站的服务不能得到有效的改进,直接加剧整合陷入恶循环。
4.数据标准执行不到位
DB32/505-2002标准是江苏省档案局根据DA/T18-1999《档案著录规则》并依据多年的实践经验,结合江苏省实际状况而制定的,该标准是为建设数字档案馆作基础准备的。其中该标准部分条款为为强制性条款,但是仍有少数档案馆未执行,执行比例为81.8%。这说明档案网站的建设依然没有完全遵循标准,存在数据库建设只从本馆馆藏建设考虑的情况。在数据库建设的标准体系上,如果各馆藏数据库数据著录标准、技术标准都不一致,这将会严重阻碍更高层次的资源整合。
三、档案网站整合存在问题的原因分析
1.档案馆资金来源不足
除了4家档案馆未填写原因外,大多数档案馆认为不能进行资源整合的主要原因是资金投入的问题。资金投入不足直接带来的问题是网站资源建设较差,不规范,技术使用简单,间接也会带来不能保证档案馆计算机人才、信息技术的及时输入,这使得资源建设没有人去维护,而软硬件设备也无法得到保障。这是江苏省档案网站整合状况较差的主要原因。
档案馆是国家公益性机构,而整合的数据库信息资源却很难在免费环境下“经营”下去。要改变这一现象,就不能用旧观念来发展信息服务,要更新观念、创造新的环境。
2.档案信息公开、共享与保密之间的矛盾与冲突
档案信息资源的信息公开与信息保密之间的冲突是另外一个阻碍档案网站信息资源整合的因素。对档案信息资源加以整合的根本目标就是实现更高程度的信息公开与数据共享,然而,这同时又涉及信息安全的问题。首先是水平较低的信息资源整合往往不能对一些档案信息的保密性进行判定,而直接就进行公开、发布;其次如果建立统一的信息资源平台,这些平台在包括黑客攻击在内的各种威胁面前的抵抗性则更加脆弱;另外,由于对信息资源过量的共享和过度的公开会增加安全风险,所以往往需要特定的权限设置体系或身份验证体系进行控制,这同时又增加了运行成本,阻碍了服务水平的提高。
3.传统档案管理体制的束缚
这是与我国传统档案管理体制分不开的。传统的档案机构管理体制是行政管理的“条块”模式,机构之间和地方之间相互分割,自成体系,这导致了信息化建设的严重分散和效率低下。对于数据库建设,各机构时常各自为政。由于各部门是自建数据库,经常不遵守国家标准,自定标准又不完善,导致数据库不规范,造成各机构网站之间难以实现数据资源的整合和共享。
另一个原因是现行的管理缺乏对档案网站建设的总体规划和协调发展,而导致数据库重复建设与开发较多,数据库建设不能相互协调、相互合作,资金投入不能发挥规模经济优势。同时,网站数据库建设泛滥,用户难以选择,从而制约了服务水平的提高,进而资源建设不能发挥经济效益,数据库管理也就越难进行。
总之,目前的管理体制使得档案网站信息资源整合重建设轻利用、重投入轻管理、重本位轻合作。
4.档案馆技术条件薄弱
档案网站信息资源整合需要更加厚实的软硬件件技术。目前,档案馆在技术力量上还显薄弱,硬件设施不到位,软件平台不规范,尤其还缺乏信息技术专业人才。从人才问题的解决方法上看,经过继续教育,现有档案管理人员可以在一定程度上适应技术操作的要求,但要其胜任文件管理系统的软件开发、数据库建设与维护、整合平台的构建等工作却有较大难度。而专业的技术人才往往又不具备档案管理业务知识。
5.“用户至上”的服务意识不高
除了上述四个原因,阻碍了档案网站信息资源的整合,还存在一些其他原因影响了档案网站信息资源整合的质量和效果。其中之一是目前档案馆工作人员的服务意识还有待提高。
档案馆是为用户档案信息需求服务的公共机构,档案利用需求是推动其发展的主要因素。但是,在我国,由于档案馆工作者的服务意识较弱,依然处于被动服务中,即有了信息需求才进行服务,不能有效地挖掘档案信息用户、主动刺激用户需求,这一传统守旧的观念使得档案网站信息资源整合建设的原则没有体现在用户服务之上,而是从档案馆自身管理的角度出发,这直接导致了档案网站信息资源整合的层次低、效果差。
6.档案法规标准建设滞后
档案法规标准的建设滞后也是江苏省档案网站信息资源整合存在一系列问题的另一个重要原因。
虽然在我国,有关档案信息资源建设的法律法规已经逐步建立了一些,但是,总体来看,在我国,关于网站档案信息资源的法制建设工作仍然比较滞后,这不仅仅体现在法规数量上,还体现在其他方面。首先,法规层次太低,综观已经出台的相关规定,其中大多数是规范性和政策性文件,关键领域和关键环节立法欠缺,不能满足实际需要;第二,由于缺乏综合性和基础性的信息资源立法,档案网站信息资源建设的众多环节工作依然受传统体制、机制、利益等问题影响,处于无序、混乱状态;第三,目前的法律法规只是零星建立的几个,尚未构成一个健全的体系;第四,已有的政策、法律、法规也很难得到严格执行。
影响整合质量的另一原因是标准建设的滞后。和档案网站信息资源整合相关的标准包括:通信标准、技术标准、数据标准、检索语言标准、安全标准等等,这些标准构成一个体系结构,用来保障整合后资源、服务的交换。在我国,标准建设往往落后资源建设,而做不到先行,因而导致资源建设比较混乱。例如,江苏省《文书档案文件级目录数据库结构与数据交换格式》是2002年的标准,距离至今已有六年时间没有出过修订版本或升级版本,而电子档案理论研究和计算机通信技术是不断发展的,这一标准如果不加维护修订的话,是远远滞后于目前国际上的理论研究成果和实践应用情况的②。当然,这也与我国国家《档案著录规则》的发展相关,国家《档案著录规则》实际上只是各类档案著录的一部“总则”,而针对数字档案或电子文件来说,《电子档案著录细则(或元数据)》国家标准的缺少对地方档案网站电子档案数据库著录格式(或元数据)标准的制定也有影响③。
总之,我国档案网站信息资源整合的现状虽有进步,但还是不能满足当下信息化水平的不断进步和档案信息用户的利用需求,这是由多方面的因素所决定的。然而档案网站信息资源的整合是网络环境下档案馆信息工作的一个重点内容,同样也是一个急需解决的现实问题,有效整合后的档案信息资源将具备共享性、系统性、专业性和完备性的特点,为档案用户的利用提供更为简便科学的方法。但这项工作涉及的理论基础、技术保障、法律规范等问题都需要尽快进行分析和研究,档案工作者应当认清形势,调整步伐,对此进行更为深入和研讨和论证,争取在新时代的网络信息服务中保有属于自己的一席之地。
注释:
①对于方法的具体介绍,可参见:江苏省档案局、南京大学《档案网站信息资源普查与整合研究》,2008年,115页。
②从国外元数据实施的版本情况上看,都十分注重元数据制定后的升级、更新和维护,DOD5015.2标准十年间出了三个版本,其中最新的是2007年版;e-GMS标准五年间出了四个版本,最新版本是2006年版等等。
③国家档案局、中央档案馆办公室已于2008年3月24日发布了《电子文件元数据标准》、《电子文件管理细则》(包括文书电子文件元数据方案、电子文件长期保存格式需要、基于XML的电子文件封装规范三部分)行业标准的征求意见稿。