关于检索的哲学思考_辩证关系论文

关于检索的哲学思考_辩证关系论文

关于检索的哲学思考,本文主要内容关键词为:哲学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

马克思主义哲学的唯物主义分为两个重要组成部分,即辩证唯物主义与历史唯物主义。辩证唯物主义就是研究对象本质自身中的矛盾,辩证法可简要地确定为关于对立面统一的学说。

对于建立检索系统及利用检索系统检索的认识,同样存在着辩证法,即存在着许多对立面统一的问题。检索系统生产者由于自觉遵循关于系统的辩证唯物主义认识论,所以才能生产出价格与质量辩证统一的优质系统。用户在检索实践中,只有不断加强辩证唯物主义的认识,才能客观、全面、辩证地认识检索系统与检索原理,取得高效率的检索结果。当然,初学用户必须自觉地经过“事物—直观—思维—认识—实践—再认识—再实践”的反复过程,才能逐渐达到客观、全面、辩证地认识检索原理、检索系统与检索结果的境界。

检索的哲学思考,不仅是检索的方法论问题,而且是检索的认识论和指导思想问题,每一个检索系统生产者和检索用户都应该明白这个道理。在检索系统的生产过程与利用系统检索的过程中,确实存在许多表面上是对立的矛盾,但是,如果经过辩证的认识,则可从本质上认识到这些矛盾又有统一的一面。下面对生产检索系统,检索过程及对检索结果认识诸方面的许多矛盾对立与统一问题,作一初步的论述。

1 生产检索系统时的辩证关系

检索系统的质量标准可用性能与价格来表征,不同系统质量的横向比较则可以各自的性能价格比来衡量。对用户来说,价格自然越低越好,然而价格与性能无疑是一对矛盾,价格过低的系统势必影响系统的性能。决定系统性能的因素有很多,例如文献源的生产国家、文献源的学科、文献源的类别(图书、期刊、专利、科技报告……)、文献源的数量、文献条目的类型(文摘、题录、全文)、出版周期、索引种类及累积索引种类,等等。一味追求文献源的完整(生产国、学科、类别完整),必然增大篇幅,提高价格,也会加大出版周期。众所周知,一些综合性的检索刊物如英国《科学文摘》、美国《工程索引》、《化学文摘》、《科学引文索引》及日本《科学技术文献速报》等,因追求完整,年报道量已达10余万条,甚至更多。其结果必然是价格昂贵,导致许多中小型图书馆根本承受不了。再拿文献条目类型来说,用户喜好的程度当然依次为全文、文摘与题录。但是,用户对相应系统价格的承受程度则相反。出版周期长短与报道条目的类型、数量也存在矛盾,进而又与系统价格有矛盾。索引、累积索引种类越多,用户的使用当然越方便,同样地会造成系统价格上涨。

检索系统性能的各个因素都与价格息息相关。总的来说,性能与价格是一对矛盾。一般地说,彼此是对立的。但是,它们也有统一的一面,即世上既没有性能可使用户绝对满意的检索系统,也没有用户绝对满意的检索系统价格。因此,系统生产者在设计系统性能与制定价格时,应辩证地对待这对矛盾,既不要无限追求性能而使用户不能承受相应的高价格,也不能一味满足用户低价格的要求,导致性能过差。因为性能太差的系统同样会失去用户。成功的系统生产者,则应在设计系统时首先对现有的检索系统,特别是功能相近的检索系统,在性能与价格两方面进行充分的调查与分析比较,然后在选定合理的市场价格前提下,吸取其它系统在提高性能方面的成功经验,尽可能提高本系统的各项性能。兼顾性能与价格的系统,才会受到用户的欢迎。

2 选用检索系统时的辩证关系

同理,用户在选用检索系统时,也要辩证地认识到,世界上既无性能绝对优良的系统,也无价格绝对低廉的系统。只有在检索实践过程中,不断地对各系统的性能与价格进行分析比较,在全面的、辩证的认识基础上,选用那些合适的检索系统。

图书馆的经费有限,其各类用户对检索系统的性能要求又多种多样。图书馆不可能为用户订购所有有关的检索系统,只能在经费限定条件下,综合考虑性能价格比,选定合适的检索系统,争取尽可能地满足多类用户的检索要求。中小型图书馆显然只能订购那些相关的单学科、单文献类型、索引类型有限的检索系统,以有限经费争取多订一些品种。那些性能虽然优良但价格高达数万元的品种,当然必须割爱。

在当前计算机与多媒体信息技术迅速发展的情况下,图书馆在选择检索系统媒体时,也有一个辩证思考的问题。使用方便的媒体系统价格就高。同一种检索系统的价格按高低顺序排依次为光盘、磁盘及印刷型媒体,其附加使用费用的高低顺序也相同。因此,图书馆在选择系统媒体时也要量力而行,像光盘版《工程索引》、《科学文摘》、《科学引文索引》等,年订购经费均在七八万至十余万之巨,这不是每个馆都能承受的。

此外,个体用户在进行计算机联机检索时,选用不同检索网络与数据库,费用悬殊。因此,要辩证考虑检索效率与费用。若时间不受限制,甚至可选择手工检索,则基本上无需花钱。

3 有用文献与无用文献的辩证关系

检索过程是从文献集中找出对用户有用文献的过程,也可以说是区分有用文献与无用文献的过程。但是,文献集中的一篇文献对用户是否有用,不是绝对的而是相对的,其中也存在着辩证的关系。

首先,从检索系统生产者来说,在对每篇文献制作条目和序化的过程中,应充分注意加工的每个环节,防止因某一环节加工失误而导致文献条目失真。一篇本该对用户有用的但加工失误的文献,在检索方法完全正确的情况下,用户却不能检索出来,于是错误地变成为一篇对用户无用的文献。

系统加工过程主要包括:对各篇文献的特征款项进行著录、编辑、标识,形成文献条目;然后按标识款项排序形成有序的可检索的文献集。若文献条目为文摘时,则还要对每篇文献的内容制作一篇短文式的摘要。系统生产者在著录、编辑、标识、编制摘要及文献条目排序的任何一个环节上发生错误,都会使用户无法用正确方法检索出那些原本有用但加工失误了的文献条目。对用户而言,文献集中这些原本是有用的文献便错误地成了无用文献。

其次,对检索用户而言,不了解检索原理和检索系统性能,不懂得检索方法,也会漏检文献集中那些原本对他有用的文献。如果他无法辩识文献条目中的某些款项,就可能漏检有用文献;或者在检索到有用的文献条目后,却因不能识别原始文献项而无法找到原始文献,有用的原始文献无疑成了无用文献。我们且不说那些不懂检索原理与方法的用户,许多有用文献对他来说,因检索不出来或找不到原始文献,当然都成了无用文献。就是一些有一定检索经验的用户,有时也难免会漏检那些原本有用的文献。因为在检索过程的各个环节中,如选择检索系统,选择作为检索入口的标识符号,对检索标识进行逻辑组合等,任一环节发生错误,都会导致有用文献的漏检。现仅举选用关键词检索为例,且不说用户选错关键词,就是选对了关键词,有时也可能发生漏检。经验丰富的用户在选用一个关键词未检索到有用文献后,便会再试用各种同义词、近义词乃至反义词检索。例如,检索“双层半层体材料界面的电阻特性”课题的文献时,若在检索式中使用“电阻”未检索到文献时,改用“电导”这个反义词,检索出的文献对课题也是有用的。因为了解了电导特性等于了解了电阻特性。同样道理,若在检索式中使用“双层”未检索到文献,则可改用“多层”这个词,因为检索到的“多层半导体材料界面的电阻特性”文献,对于研究“双层半导体材料界面的电阻特性”的课题用户来说,也是有参考价值的。

因此,对无经验的用户来说,一些本为有用的文献因漏检而变成了“无用”文献。反之,一些似乎无用的文献,通过有经验用户的巧妙检索,却成了“有用”文献。同一篇文献,从“无用”变为“有用”,有个矛盾转换的过程,也就是无经验用户通过不断检索实践,积累检索经验,增进对检索系统与检索原理的认识过程。

4 检索空间与检索时间的辩证关系

检索系统生产者一般都为最大限度地压缩系统存贮空间(文献条目与条目集空间)而竭尽全力,也就是说,尽力以最少的空间存贮最多的文献信息。于是,他们纷纷采用了各种文献信息特征款项的压缩手段,如代码、首字母、缩写及缩略词,省略款项间的标点符号,甚至省略正常款项等。以最少的空间存贮最多的文献信息,可以说是系统生产者普遍遵循的最省力原则。

对于检索系统用户来说,他们都希望以最少的时间方便地检索到最大量的所需文献,这是用户普遍所持的最省力原则。但是,对于经验不足的用户,在利用大量压缩信息存贮空间的检索系统时,不能方便地辨识压缩了的款项或省略、异化的款项;更无法辨识异化款项的潜在信息。他们利用此类检索系统时,往往花费较多的时间,仍然不能获得较好的检索结果。因此,检索系统存贮文献信息的空间与用户检索文献信息所花的时间,有时就成了一对彼此对立的矛盾。事实上,检索系统的存贮空间就是用户的检索空间。因此,我们也可简称之为“检索空间与检索时间的矛盾。”

从辩证唯物论的观点来说,世上既不存在存贮空间最小化的检索系统,检索用户也难以实现时间最少化的检索。检索空间的大小与检索时间的多少,都是相对而非绝对的。重要的是,检索系统生产者与用户均应辩证地看待检索空间与检索时间的关系,认真探索与探索空间、检索时间有关的各项因素。前者应尽可能生产出存贮空间与检索时间矛盾较小的优化系统,后者则应努力适应不同的系统,采取相应的检索途径,争取以较少的时间获得较好的检索效果。

关于这个论题,笔者曾在专文《论检索的空间与时间》中提出了决定检索空间与检索时间的重要因素是标识款项;同时指出,为减少用户检索时间,检索生产者可采用“以空间换时间”的原则,即增大系统的存贮空间,一般是采取增加文献条目标识款项的方法。用户利用此类检索系统,采用多个标识款项组成(“或”、“与”)作为检索入口,通常可减少检索时间。反之,系统生产者着眼于降低成本,则会采用“以时间换空间”的原则,即以增加用户检索时间来减少系统存贮空间。用户遇到此类检索系统,一般不能一步直接检索到所需文献条目,但若能熟练掌握通过中介款项多级检索的方法,仍能较快地完成检索。现举一个例子来说明以系统空间为代价照顾检索时间的情况。英国德温特公司《世界专利文摘》(WPA)的“登记号索引”(accession number index)不仅存贮了本期所报道的与登记号相应的专利文献,而且还以较大的空间报道了其基本专利与所有相同专利文献(有时多达数十篇),这就大量增加了存贮空间。增加空间似对检索文献本身并无额外的意义,但用户却可在一次检索中同时检索到许多国家的同族专利,并可根据专利申请国的多寡准确判断该项专利的重要程度,无疑节省了用户大量的检索时间。

5 人工检索与计算机检索的辩证关系

计算机技术广泛应用于检索,确实给用户带来了很大的方便,并节省了大量的时间。因此,少数用户便认为在计算机检索普及的情况下人工检索已无用武之地,用户已无需了解检索系统与检索原理,似乎一切依赖于计算机检索,便可轻而易举地获得所需文献了。实际上这种观点是不符合客观实际的,是主观、片面的。

首先,计算机检索系统较人工检索系统的经费投入要大得多,用户在利用计算机检索系统时的花费也较大。而人工检索用的检索刊物经费投入少,用户利用刊物人工检索基本上又是无需花费的。因此,计算机检索之节省时间是以金钱为代价置换来的,就花费而言,人工检索则比计算机检索优越,可见计算机检索并非没有缺点,完全否定人工检索显然是片面的。

其次,从检索过程与检索结果来说,在制订检索策略和随时修改检索策略方面,计算机是不能完全替代人脑的,尤其替代不了经验丰富的用户大脑所积累的智慧与经验。计算机只能呆板地执行指令,当用户输入检索词或检索词逻辑组合式后,它只能将它们与数据库中各条文献记录进行机械地比对,命中就输出,不命中即无输出。

用户花了钱又花了时间,很可能输出结果为零,即使发生漏检,用户也只能望“机”兴叹。经验丰富的用户在人工检索时,不仅是机械地按初选的检索词或检索式,对各条文献记录逐条浏览比对,他还能在比对过程中充分运用自己的智慧与经验。例如,随时改用初选检索词的同义词、近义词乃至反义词,巧妙地检索出那些实际上有用的文献。再如,他在检索过程中可随时调整检索词,如改用同范畴的上位词或下位词,或者改用前方一致、后方一致、词干一致,扩大或缩小命中范围,使检索结果更为完全或更为准确。第三,他还可在检索过程中随时对某些检索词加权乃至调整检索词的组合方式,以提高检索效率。相对计算机检索而言,人脑在人工检索中还有许多潜力(智慧与经验)可用于提高检索效率,这里就不一一列举了。

随着因特网各种检索服务的出现,如自动标题搜索的阿奇服务与自动内容搜索的广域信息服务系统服务,确实给智能型计算机检索带来了曙光。但笔者认为,任何智能型检索软件都是人发明的,因此,计算机永远不会超过发明人对检索原理、检索过程的理解,它永远要依赖于人脑对检索的理解。再说,至目前为止,由于因特网信息传输速度有限,网上用户又爆满,利用因特网检索信息传输时间往往过长,其信息传输费用也相应增加,因此,用户在检索时间与花费上并非都能承受得起的。

总之,人工检索与计算机检索像任何事物一样,都有其自身的优点与缺点。计算机检索永远也不能完全代替人工检索的优点,因此,每个用户务必辩证地看待“人”与“机”的关系。

6 检索结果的辩证关系

检索总是要使用户花时花钱的。在投入一定的时间和金钱进行检索后,检索结果命中文献的数量是多为好?还是少为好呢?少数用户认为花了时间和金钱,当然命中文献越多越好,否则不是吃亏吗?如果一篇也未查到,不是花了冤枉钱吗?甚至有的检索服务人员也有这种想法,收了用户的钱,查到的文献很少甚至为零,这样似乎对不起用户。关于检索文献多与少的问题,我们也应该辩证地看待。“越多越好”的观点无疑是片面的,对于这个问题,要求我们全面地、客观地分析用户不同的检索目的。

有的用户为科研立题而检索,这又可分两种情况。一种是为论证开创性科研课题而检索,如果检索出的文献很多这就糟了,这说明已有许多人从事同一课题,还谈什么开创性。因此,检索到的文献不仅要少,最好一篇也没有,这样才说明尚无人从事此课题研究,从而论证了课题是开创性的。还有另一种情况,对于一些已经有人从事的科研课题(热门课题),但短期内尚不可能获得突破性成果,可是这些课题对人类进步具有重大意义,如核聚变能源、实用高温超导材料、统一场论模型等。此时,用户为决定是否参与这些科研课题进行检索时,所检索到的文献数量则不是主要的,主要是看文献内容所反映的科研成果情况。

对于进行科研成果鉴定或申请专利、申请奖励的用户,检索到相关文献的数量应越少越好,最好是零。相关文献的数量反映了成果的先进性的程度,如果没有相关文献,则说明了该成果的独创性。

多数用户是为自己正在从事的科研项目找寻参考资料而检索的。这些用户也应辩证地看待检索结果。检索到的相关资料较多,对推动科研有利,当然是件好事。但检索到的相关资料较少,也不一定就是坏事。因为如果科研成果不保密的话,说明同一课题的竞争对手还未获得多少实质性进展,相反这对自己应是件好事。

综上所述,在确信检索正确,即未发生错检与漏检的前提下,检索用户以及检索服务人员对于检索结果都应进行辩证的分析,客观地、全面地面对检索结果,才不致产生迷惑。

7 正常款项与异常款项的辩证关系

在检索出所需文献条目后,还需正确辨识其中的各个款项。在正常款项与“异常款项”之间也有许多辩证关系,不能辩证地识别各种异常款项就会影响检索效果。

许多国家的文献工作标准系列中,都有专门的关于检索系统(刊物、数据库)文献条目中基本特征款项(或字段)的标准。基本特征款项是组成检索系统文献条目的必要款项,因而它们是一些正常的款项(常项)。常项的信息功能保证了文献的可检性,也与检全率、检准率密切相关。换言之,缺少任一常项都不仅影响文献检索的检全率与检准率,甚至影响文献的可检性。

某些检索系统的条目中存在着不同于常项的一些款项,其中有的看来比较特殊,有的似是多余的,有的则似无而实际存在。相对文献条目中的常项,它们可统称之为异常款项(异项)。异项在表现形式或信息功能上不同于常项,因此都是一些实际存在的特殊款项,按照异项与常项所含信息不同的辩证关系,异项可分为空项、余项与奇项。

7.1 空项 空项是指文献条目正常序列中应该存在而实际未存在的款项。表面上看来某些常项空缺,相对实际存在的常项而言,它们是“空”、是“无”。但就表达信息而言,它们只是表面上的“空”与“无”,实质上却是“实”与“有”的。检索系统的文献条目中存在着不少“空”项,现仅举一例说明之。如英国《世界专利文摘》(World Patent Abs-tracts)文摘条目中规定有“专利权优先”项,因此,它是一个常项。有些条目中却缺乏此项,表面上这里出现了一个“空”项。但经验丰富的用户却能从表面上的“空”项中看出其中蕴含的潜在信息,即了解到《世界专利文摘》首次报道的发明内容,从而更重视这条文摘。因此,空项与常项,是“空”与“常”、“无”与“有”的辩证关系,表面上它们是一对对立的矛盾,但它们又都有统一的一面,即互相转换的一面。对于经验丰富的用户来说,他们能识别出“空”项,特别是识别出它们所蕴含的潜在信息,因此,“空”项对他们来说就是“常”项。反之,缺乏经验的用户连某些常项也不能认识,对他们而言,这些常项,也就成了空项。

7.2 奇项 文献条目中某些款项在表现形式上似不同于一般常项,它们一般比较奇特,相对于常项此类款项可称之为奇项,现举一例以示之。在美国《工程索引》(EI)中,“著者姓名”项处常会出现"Anon"字样,此显然不属于西方人、俄国人,也不属于中国人、日本人的姓名形式,因此比较奇怪,可谓之为一种“奇”项。

实际上,“奇”项似奇非奇,只是某些用户因不能辨别其蕴含的信息而感到奇怪罢了,这正应验了“少见多怪”这句成语。对经验丰富的用户来说,因能辨别并理解其隐信息,就未必视其为奇。对于"anon"这个“奇”项,若知道它是“anonymous(匿名)”的缩写词,就不会认为它是“奇”项了。反之,因缺乏检索经验,一个常项无法辨认也可能视之为“奇”项。因此,奇项与常项也是表面上对立的一对矛盾,但它们在一定条件下会互相转换,这正是矛盾双方统一的一面。

7.3 余项 在一些文献条目中,除了正常款项外,还多出了一些款项。相对于必要的常项来说,它们似乎是多余的。例如,在有的科技报告检索刊物条目中,报告号以如下形式"No 90-13345 order as No 90-13311"出现,其中的"order as No 90-13311"在某些用户眼中可能就认为是冗余款项,即“余”项。但是任何检索刊物的生产者都不会浪费刊物宝贵的篇幅,真正的“余项”实际上是不存在的。经验丰富的用户就会认为此款项很平常,了解它所告诉用户的信息,即要获取90-13345号科技报告,需订购90-13311号科技报告。

总之,检索系统条目中任一种异项与常项都是相辅相成的对立统一体。没有常项的概念,也就无所谓空项、奇项与余项,用户在使用各种检索系统过程中,应自觉运用辩证唯物论的认识方法,深入挖掘每个“异”项隐含的潜在信息,才能提高文献检索的效率。

标签:;  ;  ;  

关于检索的哲学思考_辩证关系论文
下载Doc文档

猜你喜欢