全文检索技术在我国新型公共档案馆建设中的应用,本文主要内容关键词为:档案馆论文,在我国论文,全文论文,建设中论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
谷歌、百度等网络搜索引擎之所以大受用户欢迎和喜爱,一个重要原因就是其强大的搜索功能能在海量信息中将所需的内容快速搜索出来反馈给用户,而之所以能做到这一点,主要在于全文检索技术的应用。同传统的档案信息检索技术相比,全文检索技术具有的检索全面性、用户友好性以及能根据信息内容完成检索的特点。在公共档案馆馆藏资源不断丰富、电子文档与档案馆数字档案馆建设基本完成之时,作为提供档案信息服务机构的公共档案馆,引入全文检索技术,对我国加快推进新型公共档案馆建设,更好地开展档案信息服务利用工作,提供了一个切实可行的方法和入口。
一、我国新型公共档案馆建设中应用全文检索技术的背景分析
我国《档案法》第十三条规定:“各级各类档案馆,……采用先进技术,实现档案管理的现代化”;第十九条规定:“档案馆应当定期公布开放档案的目录,并为档案的利用创作条件,简化手续,提供方便”②。由此可见,各级各类档案馆采用先进技术,实现档案管理现代化并为社会利用档案提供方便,是法律赋予各级公共档案馆的义务。2009年10月30日,国家档案局在上海召开的全国档案馆工作会议中,杨冬权局长在题为《以丰富馆藏、提高安全保障能力和公共服务》的讲话中提出,下一个十年,全国档案馆工作的主要任务是搞好馆舍建设、馆藏建设、信息化建设、公共服务建设等,努力把各级档案馆建设成“五位一体”的新型公共档案馆,实现档案馆事业的跨越式发展③。
与此同时,随着我国公民档案信息意识和自我维权意识的不断增强、电子文件数量的几何级增长,衍生出新形势下新的档案需求,公民通过到公共档案馆(或数字档案馆)查阅档案原件来解决关系到个人生活的案例逐步增多,涉及土地所有权、房产归属、学历学位、婚姻证明、工作调动、财产继承等方方面面。因此,新形势下广泛的档案利用需求必然要求有新的服务方式来支撑和适应。全文检索技术作为目前最先进、有效的信息检索技术,可以为公共档案馆实现档案管理现代化提供必要的技术条件支撑。
在国外,公共档案馆因其便利性,能及时满足复杂多样档案用户的档案需求,而得到公众普遍认可,社会地位普遍较高。而在我国,公共档案馆因长期处于封闭或半封闭状态,边缘化趋势明显,社会认可度低。各级各类公共档案馆在信息资源占据经济社会发展主导地位的今天,及时、有效、合理地开发所属档案信息,便于档案用户使用,保证稳定的档案用户群,实现自身职能转型,已迫在眉睫。
不管是法律赋予的义务,还是为自身生存、发展谋求出路,抑或是包括全文检索技术在内的现代信息技术的不断成熟和普及,全文检索技术应用于我国公共档案馆,提升公共档案馆服务水平和质量,已是至关必要。
二、全文检索技术在我国新型公共档案馆建设中的积极作用
全文检索技术,凭借强大的信息检索功能,为公共档案馆实现服务利用方式的转变、全面提升公共档案馆档案管理的信息化水平提供了一条切实可行的途径。
1.有助于转变公共档案馆服务理念,提高服务水平
人类社会已进入信息时代,档案馆存储的档案,档案的信息属性日益凸显,档案已被视为当代社会一种核心信息资源④,社会对这些档案的需求量逐步增大。档案价值的实现,只有通过档案馆对档案的不断开发,才能使档案资源得到广泛利用,进而实现档案价值由潜在价值向现实价值转变。公共档案馆守着一堆“宝贝”,却不懂得利用这些“宝贝”,以此来提升自身的社会地位和社会影响力,是对资源的一种极大浪费。
按照《中华人民共和国档案法实施办法》第二十二条规定,各级各类档案馆在为社会提供利用档案时,可以按照规定收取一定的费用。可见,公共档案馆在开展档案信息服务时,收取合理的服务费用,具有法律依据。同时,从国际通行做法来看,也并无不妥。各级各类公共档案馆,在条件允许的情况下,建立基于全文检索技术支撑下的软件管理平台,提供多种检索途径,根据档案用户需求,开展档案信息咨询服务,如“在线咨询”、“电话和Email咨询服务”等,保证档案用户及时获取到所需档案信息,在此基础上收取一定的费用。如此一来,一方面,可以提高档案馆日常运行经费和档案工作人员的经济收入水平;另一方面,档案用户乃至社会能及时获取到所需档案信息,会逐步形成对各级各类档案馆档案的依赖性,档案信息利用需求不断提升。对档案馆及档案工作人员而言,通过自身努力,其工作能不断得到认可,自身价值逐步得以实现,根据社会学的社会角色理论,角色和社会地位是一对集合体,档案馆及档案工作人员在整个社会体系中会扮演着越来越重要的角色,同时享受着较高的社会地位。这样一来,可最大限度地促进公共档案馆及档案工作人员的工作积极性和主动性,也可促进公共档案馆及档案工作人员实现由传统被动式服务理念向积极主动式服务理念的转变,不断创新档案服务方式,及时提供用户所需档案信息,提高档案服务水平和服务效果。
2.有助于提升公共档案馆档案信息服务工作效率
对传统的公共档案馆档案信息检索而言,无论是最为传统的人工检索方式,还是半智能化的档案检索方式,都有一个共同点:不仅费时、费力,而且其查全率、查准率不高,公共档案馆档案工作人员工作量大,工作效率低。传统的人工检索方式通过档案馆工作人员查找事先编制好的索引目录,然后在档案库房中再经历由全宗—年代(机构)—卷内目录—文件这样一个查找过程,查找一份文件有时需花费较长时间,如果查找多份文件,则需更长时间;而半智能化的档案检索方式,公共档案馆工作人员一般也是在事先著录标引的基础上,通过计算机辅助,查找到某份文件的相关外在信息,然后再去相应的库房位置将档案取出,这种半智能化的档案检索方式其检全率、检准率都很大程度上取决于事先对文件的著录、标引质量以及查找人员对库房档案内容的熟悉程度。相对于传统的档案馆档案检索方式,全文检索方式提供多条检索途径,档案信息用户可通过计算机直接检索到所需档案全文,而无需在到档案库房中进行查找(除非确有必要,由档案馆工作人员找出原件)。查找到所需信息变得更加容易,与此同时,在建立全文档案数据库时,因为公共档案馆中所有档案资源都事先经过档案工作人员精心地著录和标引成结构化的档案信息,因此不容易造成重复开发,为公共档案馆节省了大量的管理成本和时间成本等,不断提升了公共档案馆档案服务工作效率。
另一方面,全文检索技术可将档案全文中任何有意义的词作为检索词在全文档案数据库中进行查找,同时,全文检索技术中所采用的同义词表(如“计算机”与“电脑”同义;“中国”与“中华人民共和国”同义)以及自动切词技术(如搜索“单体”,“简单体系”则自动被排除)都可使用户迅速检索到此档案馆中用户所需档案。工作人员也可有更多精力,根据档案价值大小,基于需求导向原则,实行分级开发策略,将更多有用档案及时开发。
3.有助于拓展公共档案馆档案信息服务形式及范围,提高档案服务质量
随着现代声像记录技术的广泛应用,现代公共档案馆馆藏资源不断丰富,馆藏结构不断优化。公共档案馆除收集纸质档案,还收集图片、音频、视频等多种形式的声像档案,进而保证某一事件的全面性和真实性。就目前全文检索技术而言,不仅支持通过各类图标制作软件、音频视频制作软件将图片、声音、视频进行格式化处理,而又不改变图像、声音、视频等本来面貌的多媒体数据库建设,同时还能通过建立一套通用的标引方法将其检索出来,充分保证所检索的各类格式的档案均为档案原件(电子手段展示档案最初原貌),进而满足档案用户更高层次的个性化需求——能提供关于某一事件或主题所有的图片、声音、视频等档案形式,而不仅仅只局限于文本型档案。
另一方面,在与全文检索技术相匹配的全文档案数据库的建设中,档案服务人员已事先将馆藏档案都精心地著录和标引成结构化的档案信息,同时,对输入的馆藏档案都设置相应的保密级别,不同档案用户对应不同的级别。因此,档案用户利用全文检索技术时,在相应级别前提下,可获得最为全面、广泛和准确的档案信息。这样一来,既保证了档案信息的安全性,也保证了档案信息检索的检准率和检全率,提高了档案馆档案服务范围。
各级各类公共档案馆在提供档案信息服务时,既有多样的档案信息形式,又可获得某一事件或某一主题的更为全面、广泛的档案信息,有助于提高公共档案馆档案服务质量。
4.有助于延长公共档案馆馆藏纸质档案,特别是珍贵档案和高龄档案的寿命
传统的档案检索最终都要深入库房,调阅档案原件(部分用仿制品取代),显然多次查阅原件和复制原件会加快原始档案的破损、污损,从档案价值来看,这对于档案价值的发挥显然不利。在全宗档案群中,“高龄档案”和一些特别珍贵档案一般都是孤本,一旦损毁,将不复存在。最大限度地延长这些“高龄档案”和珍贵档案的寿命,发挥档案价值,是公共档案馆面临的现实问题。全文检索技术通过事先一次性电子扫描和识别技术将档案数字化后导入全文数据库。档案信息检索用户需查找利用时,可直接通过计算机用户端查找到档案全文,在需要时通过在检索设备上连接打印机即可得到所需档案的复印件(为证明其真实性和可靠性,可由档案馆出具相关证明),在很大程度上减少了调阅档案原件和复印档案原件等行为,进而减少了因直接接触对档案原件所造成的损毁,有助于延长档案寿命。
三、全文检索技术运用于新型公共档案馆建设中面临的问题
目前绝大多数公共档案馆对馆藏档案都已进行了数字化转换并且随着当前信息技术的快速发展,特别是数据库技术、数据挖掘技术、输入输出技术等一系列技术的长足发展,又为全文检索系统提供了技术支撑。有了上述保障条件,全文检索技术在部分档案馆⑤的实施使用,取得了一定的积极效果。同时,使用全文检索技术从理论上来讲,也较为简单,但是,当前全文检索技术要在公共档案馆中得到普遍使用,还面临着一系列问题:
1.全文档案数据库建设难度大
全文检索技术的使用,全文档案数据库的建设是重中之重。随着办公自动化和信息技术的发展,电子文件增长迅速,各级各类公共档案馆传统的纸质档案数字化处理也形成了大量的数字化信息。但从笔者对一些省市档案馆的调研中发现,无论哪一级别的档案馆其馆藏档案均仍以纸质档案为主。在仍以纸质档案为主的公共档案馆,建立全文档案数据库,除需将馆藏所有纸张档案通过电子扫描转化成数字化的图像档案、通过诸如OCR(Optical Character Recognition)将数字化的图像档案再识别成特定的数据格式外,公共档案馆档案工作人员还需对所有数字化档案进行必要的著录和标引,其工作任务量之大、对档案工作人员的专业知识、技术水平要求之高以及对资金要求之多,已甚难完成。另外,公共档案馆其自身特性决定了它不同于其他公共职能机构,档案馆需保存诸如“高龄档案”和比较陈旧的档案,而这些原件大多破损、残缺、污损;与此同时,档案馆保存的相当数量手写档案,因笔迹不一、笔体不同及书写不规范,这些档案的识别工作将更是一建设巨大难题。
前期建设的多数全文档案数据库,由于软件功能设计不足、数据库系统阈值限制等原因,或多或少遭遇数据库“胀库”问题⑥。同时,新建设的全文档案数据库既要能满足眼前需要,还需考虑到长远发展需求。到底全文档案数据库采用何种标准建设,在公共档案馆馆藏档案数量,特别是电子文件数量呈现几何级增长的时代,是摆在各级各类公共档案馆面前一个亟待解决的难题。
2.全文检索技术并不适用于所有档案信息资源
一方面,从档案利用者的角度来讲,档案利用者关心的是档案信息查找时的便捷、省时且并不复杂的利用程序。在公共档案馆档案全宗群中有相当一部分档案是以专题形式存在,其本身信息量并不大,对其进行简单的著录、标引,建立索引,就可方便地查找到这些专题档案信息。而且近年来,各公共档案馆积极组织编研,其编研对象中主要就是一个个专题档案,对那些经考证历史价值高、用户查找利用次数多的专题经过整合形成二次文献、三次文献,查找利用时较全文检索技术而言,其实可能还更为方便,对这些专题档案花费大量人力、物力用于前期投入工作建设全文档案数据库,从经济学成本-效益角度来讲,并不能实现档案馆有限资源的最优化利用。另一方面,由于档案是一类特殊的信息资源,其保密性、安全性要求较高,各公共档案馆都有大量涉密档案,因全文档案数据库包含档案的全部信息,无论采用多么先进的档案保密技术,在电子化环境下相对传统纸质档案而言,毋庸置疑更容易泄露,特别是对那些事关国家安危、民族存亡的绝密档案,一旦泄露,后果将不堪设想。因此,对公共档案馆中有关保密性较高的档案,从安全性角度考虑,也不宜采用全文检索技术。
3.档案用户类型复杂多样、层次参差不齐,档案信息需求不一
在全文档案数据库下实现的全文检索技术相对传统检索方式,其先进性、检索的有效性不容怀疑。各级各类公共档案馆其档案利用者(或档案服务对象)不仅来自各行各业,档案用户类型复杂多样且数量庞大。这些档案用户由于所从事职业、工作任务、档案(信息)素养、语言(汉语、英语、档案检索语言、计算机语言等)能力的不同⑦,会形成复杂多样的个性化档案信息需求,而且随着时间的推移,这种个性化的档案信息需求会越来越难满足。因此,用相同的检索方式去应付和满足所有档案用户的档案信息需求,特别是在当前我国公众档案意识逐步提高、档案利用逐步便利的现实状况下,全文检索技术在各级各类公共档案馆中的普遍运用还将经历一个较长的时间跨度。
最后,全文检索技术在各级各类公共档案馆中的推广应用必须依赖既有较高的档案专业水平,又必须是懂数据库技术、懂信息组织和信息检索且具有较为长远的战略规划和眼光的专门人才才能实现,而目前我国各级各类公共档案馆档案人员队伍中所呈现的档案管理人员数量不多、专业化程度较低⑧以及复合型人才缺乏等并未从根本上彻底改变。因此,专业人才队伍匮乏也是制约全文检索技术在各级各类档案馆有效开展运用的问题之一。
四、加快推进全文检索技术在我国新型公共档案馆应用的几条建议
全文检索技术全面应用于我国新型公共档案馆,从总的来讲,就是要构建一个基于全文检索技术支撑的软件管理平台,这一管理平台包含全文档案数据库和档案利用服务系统两部分,其中全文档案数据库是关键和核心,档案利用服务系统是档案馆对外提供全文检索的前端服务窗口。
1.做好顶层设计,统筹兼顾。也即对该项工程“整体理念”的具体化,从公共档案馆馆网总体建设状况和各级各类公共档案馆实际情况,有计划、分层次、分阶段逐步推进开展,制定相关的标准规范,通过在不同层级公共档案馆中构建具有兼容性的软件管理平台以及通过先小范围内试验,后推广,树示范典型等方法,加快推进全文检索技术在我国新型公共档案馆的普及应用。做好顶层设计,也即意味着在具体实施前,经过科学论证,不盲目仓促上马,统筹兼顾现有资源,既考虑到眼前需要,也兼顾到长远发展需要。
2.建立配套的实施保障体系。为确保推进全文检索技术在我国新型公共档案馆的应用,除需具有国家层面稳定的政策支持,还需相应的技术和非技术方面保障。因此,一方面要出台相应政策,为全文检索技术在我国新型公共档案馆的积极推进,提供好的政策环境;另一方面,要使得全文检索技术和相关的配套应用技术不断成熟。管理平台建设、保障检全和检准的自动切词方案、保障档案信息的安全策略等均需有相应成熟技术才能予以保障。与此同时,档案馆需及早转变服务理念,档案馆工作人员要快速实现角色转换,除此之外,还需建立便于该项工作积极开展的组织管理体制(即通过一定的管理方式实现管理资源的最合理分配,各档案馆在我国集中制管理体制下,立足档案馆实际,实现与之相对应的管理模式,充分发挥该种管理模式的作用,以变应变),通过合理的制度设定来约束、督促各类人员,通过引进、培训、深造、交换等多种方式使得档案馆人才结构合理化以及通过多种渠道积极筹资,确保经费所需。最后,档案馆要积极营造良好的工作氛围,确保档案馆工作人员心情愉悦便于沟通交流。
3.将其纳入考核指标体系中。当代公共档案馆的性质已经从单纯的科学文化事业机构转变成集科学文化和信息服务于一体的机构,这也就决定了当代公共档案馆是建设服务型政府的重要部分,公共档案馆是政府对外开展信息服务的一个重要窗口,直接关系到政府形象和为民众提供服务的水平。全文检索技术作为目前最先进、有效的信息检索技术,很大程度上能够为公众提供一个便捷的信息获取通道。因此,应将其纳入相应的考核指标体系中,进而保障和加速推进全文检索技术在我国新型公共馆的应用。一方面,在政府对公共档案馆进行日常和年度考核时将其作为考核指标之一且占据相当大的权重,并且将其考核结果作为下一年度对公共档案馆各种资源分配(人员编制、拨款额等)的重要参考;另一方面,在对公共档案馆档案工作人员的日常和年度考核时,也将其作为重要考核指标,将其考核结果作为个人晋升、培训、物质奖励等的参考依据,最大限度的发挥档案工作人员的参与性、能动性和创造性。
注释:
①全文检索技术是以各类数据,诸如文字、图像、声音、视频等为处理对象,提供按照数据资料的内容而不是外在特征来实现信息检索的一种检索技术。
②中华人民共和国档案法[EB/OL].[2012-10-30].http://www.saac.gov.cn/xxgk/2010-02/08/content_1704.htm.
③杨冬权在在全国档案馆工作会议上的讲话[EB/OL].(2009-10-30)[2012-10-30].http://www.saac.gov.cn/zt/2009-10/30/content_2341.htm.
④黄宵羽.外国档案管理学[M].北京:中国人民大学出版社,2008:263.
⑤王光越.中国第一历史档案馆“全文数字化清代档案文献数据库”第一期建设成果——《大清历朝实录》、《大清五部会典》顺利通过验收[N].中国档案报,2007-11-19(1).
⑥张健.档案数据库“胀库”问题研究[J].档案学通讯,2012(4):49-51.
⑦刘耿生.档案开发与利用教程(第二版)[M].北京:中国人民大学出版社,2010:194.
⑧胡鸿杰.化腐朽为神奇——中国档案学评析[M].上海:上海世界图书出版公司,2010:52.
标签:全文检索论文;