略论档案检索的方式与方法,本文主要内容关键词为:方式论文,档案论文,方法论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
[摘要] 本文论述了手工档案检索和计算机档案检索的一般方法与步骤,讨论了档案检索提问分析以及检索策略制定等问题。
[关键词] 档案检索方法 手工检索 计算机检索
系统研究和掌握档案检索方法,灵活运用各种档案检索技术,能提高检索效率。
1 档案检索的两种方式
1.1 手工档案检索方式
手工档案检索,是依靠档案检索人员的手翻、眼看和脑子判断来进行的。目前,手工检索作为传统的检索方式,在许多档案馆仍处于主导地位。与计算机检索方式相比,它有着许多独特的优点。
(1)不需要专门的检索机具,在各种时间、地点和条件下都可进行,具有广泛的适应性与方便性。
(2)省去了购置和维护检索机具的费用,对检索环境没有太高的要求。
(3)可以随时获取反馈信息,及时调整检索重点和范围,减少漏检和误检的产生。
(4)不受时间、收费等因素的影响,检索人员可以从容地进行检索。
手工检索方式也存在许多缺点,主要表现为检索过程一般较长,检索速度较慢,效率较低,对任务紧、难度大和较为复杂的检索课题往往难以满足需求。
手工检索的具体方法与步骤如下:
(1)熟悉检索工具。要了解本馆(室)所设置的检索工具的种类、收录范围、编排方式、功能等,为查找某方面的档案选择恰当的检索方式。
(2)明确检索要求。针对某一具体的检索课题,弄清检索目的、检索角度、深度与广度。
(3)选择合适的检索途径。选择什么样的检索途径,要看利用者对所要查找的档案线索的掌握程度。例如,已知文号,可查文号目录;已知责任者,可查责任者目录。如果没有掌握什么线索,则可通过分析检索课题的主题,选择内容检索途径,查找分类目录和主题目录等。
(4)转换检索标识。如果选择的是分类和主题检索途径,在检索过程中就须将检索课题的主题概念转换成检索标识。由于概念转换须借助于档案分类表和主题词表,检索人员应熟悉分类表和主题词表的结构、功能与使用方法。从实践情况看,概念转换是手工检索中比较困难和比较关键的一个步骤。
(5)根据检索标识在各种卡片式和书本式的检索工具中进行查找。在检索过程中,应根据检索要求随时调整检索范围。检索范围的调整包括扩大、缩小或改变检索范围几方面,可利用分类表的等级体系或词表的参照系统与范畴索引来实现。
(6)提取档案。获得与检索课题相关的档案线索后,就可根据检索工具提供的出处提取档案,进行甄别、筛选和利用。
(7)分析检索结果。如果一次检索达不到较高的检全率、检准率,可另外选择检索途径,重新进行查检,直到获得满意的结果为止。
1.2 计算机档案检索方式
计算机检索由于采用了现代化技术和设备,其检索方式与手工检索方式有根本不同。计算机检索是在构造和执行检索策略的过程中进行的,检索策略是根据检索要求和检索系统的具体情况所制定的检索方案,它是用计算机能够理解和处理的书面提问表达式表现出来的。在计算机检索中,由于检索标识与文献标识之间的对比匹配工作是由机器进行的,因而必须把情报提问转化成计算机可以识别的形式,这就需要事先拟定周密的检索策略,以便使检索顺利进行。
计算机检索的具体方法与步骤如下:
(1)明确检索要求和检索目的,确定大致的检索范围。
(2)根据检索要求选择数据库(或文档),并确定检索途径。
(3)对用户提问进行概念分析,依据检索词表将分析出的主题概念转换成检索标识。
(4)运用布尔逻辑算符构造检索提问表达式。
(5)输入提问表达式,由计算机对文档进行查找,检出相关文献。
(6)分析检索结果,若不符合要求,则对提问表达式进行修改,并且重复第5步,直到满意为止。
2 档案检索提问分析
检索提问是利用者实际表达出来的检索要求。档案检索提问分析是对档案检索课题所作的主题分析,目的是弄清利用者真正的检索要求,以便确定检索对象和检索范围。
2.1 检索提问分析的内容
(1)检索目的:是为了查证某一事实,还是为了研究某一问题。
(2)检索对象:是检索档案中包含的信息,还是检索某一特定的档案。
(3)检索范围:检索何种类型及何时、何地与何种专业范围的档案材料。
(4)现有档案线索:如立档单位的名称、职能、沿革,检索对象的时间、地点,档案责任者、文号、图号,相关联的人物、机构、事件,等等。掌握的线索越多,就越有利于档案检索的进行。
2.2 影响检索提问分析的因素
由于种种原因,用户的检索提问往往不能准确全面地表达其真正的检索要求,从而增加了检索提问分析的难度。主要表现在以下几方面:
(1)有些用户往往把提问局限于那些认为检索系统能够提供的信息范围内,而不一定是他的全部需求。例如:有的用户对档案机构或检索系统提供档案信息的能力有所怀疑,认为不能满足自己的要求;有的用户认为自己的时间、吸收能力和经济能力有限,没有必要正式提问。此外,有些用户为了保密,不愿将自己的要求和盘托出。因此,检索提问往往被缩小、放大或偏离了真正的检索要求。
(2)用户对检索要求的表达受用户水平和系统语言的影响,常常出现误差。有些用户受自身水平的限制,在表达自己的信息需求时难免出现含糊不清、词不达意甚至错误表达自己的检索要求的情况。另外,目前的档案检索系统绝大多数采用的是受控语言,而不是自然语言,用户对这种受控语言往往很陌生,难以用它来精确地表达自己的需求,在这种情况下,表达出现误差是不可避免的。
(3)用户为实现其研究、查证等检索目的而应当提出的检索要求暂时还没有被意识到,这种潜在的信息需求往往随着检索工作的进展逐渐明朗起来,转化为现实的检索提问。因而,需要作进一步的提问分析。
由上分析可见,如果把用户实际提出的检索提问,看作是其全部信息需求,那就片面了。用户潜在的需求不一定都能被转化为检索提问,用户的检索提问也不一定完全反映他的检索要求,表达中的误差时有发生。因此,弄清用户的真正需求,并不是件容易的事,这就需要对检索提问进行深入的分析。
3 档案检索策略的制定
3.1 检索途径的选择
根据用户的检索提问,选择合适的检索途径,决定档案检索入口。对某一特定的检索要求选择什么样的检索途径,决定于利用者对档案线索的掌握程度以及检索工具、检索系统的设置情况。对于手工检索来说,检索途径的选择就是决定采用哪种检索工具进行检索,可以是分类目录,也可以是主题目录;可以是题名目录,也可以是文号索引等等。而对计算机检索系统来说,则包括对数据库的选择及检索项目的确定。检索项目包括待检数据库中各种规范化代码(如分类号、产品代码、国家或地区代码、机构名称代码等)以及表示主题概念的检索词。在计算机检索中,检索词包括主题词和自由词,一般总是优先选择主题词作为最基本的检索项目。因此,主题检索途径是计算机检索的主要途径。
3.2 检索标识的选定
选择好检索途径后,即可根据分类表或词表,将表达用户提问的主题概念转换成检索标识。所选择的检索标识适当与否,取决于对检索提问进行主题分析的正确性和全面性以及标引的准确性与专指性。
3.3 检索式的拟定
检索式是检索策略的具体表现形式,它是对检索提问的逻辑表达,也称检索提问表达式。根据检索课题的主题内容选定了检索标识后,就可以用布尔逻辑算符和一些检索指令,将检索提问中各有关概念之间的关系表达为布尔检索式。检索式的拟定有一定的技巧,其基本要求是:
(1)应完整准确地反映出检索提问的主题内容;
(2)应遵守待检数据库的检索用词规则;
(3)应符合检索系统的功能及限制条件的规定;
(4)应遵守概念组配原则,避免越级组配;
(5)注意检索式的精练,能化简的检索式应尽量化简。
3.4 检索策略的调整
档案检索过程比较复杂,由于种种原因,检索结果往往不能完全满足检索要求,这就需要及时修改和调整检索策略,进行反馈检索。一般来说,需要进行反馈检索的课题有两种类型:一是未达到检索目标,或用户又在原来检索的基础上提出了进一步的检索要求;二是由于构造检索策略不当所造成的检索失误。不管是哪种情况的反馈检索,都需要对用户提问和检索结果进行进一步分析,在原有的检索基础上扩大或缩小检索范围。
对于需提高检全率的课题,常用以下方法扩大检索范围。
(1)降低检索标识的专指度,可从词表或检出文献中选一些上位词参加检索。
(2)删除检索式的某个组面,调节检索网罗度。
(3)增加用逻辑和联结的相关检索词,进行族性检索。
对于需提高检准率的课题,常用以下方法缩小检索范围。
(1)提高检索标识的专指度,增加或换用下位词和专指性较强的自由词。
(2)用逻辑与联结一些进一步限定主题概念的相关检索项。
(3)用逻辑非排除一部分不需要的档案材料。
(4)在检索标识后注明关联符号和职能符号,以避免概念的误组配,提高检准率。
(收稿日期:1996-09-02)