信息组织研究述评_搜索引擎论文

信息组织研究述评_搜索引擎论文

信息组织研究述评,本文主要内容关键词为:述评论文,组织论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 问题的提出

20世纪40年代以来,随着高新技术尤其是信息技术的迅速发展,人类社会逐步跨入信息时 代 ,人们越来越清楚地认识到信息的重要价值,信息也已逐步成为这个时代的核心资源。事实 证明,世界上凡是较好地开发利用了信息资源的国家和地区,其社会经济都得到了较快的发 展。然而,对于21世纪的信息用户和信息管理者来说,困扰他们的不是信息太少,而是信息 过多的问题。据日本科技信息中心(JICST)估计,现在世界上每年大约生产科技文献450万篇 ,其中科技期刊论文约为200万篇,专利文献约为100万篇,其他类型的科技文献约为150万 篇左右[1]。人们虽然身陷信息的汪洋大海,但却处于寻找不到自己所需要的信息、吸收 不了对自己有用的信息这样一种尴尬的局面,反而造成信息利用率的不断下降。因此,怎样 获取信息和过滤信息,怎样组织信息和推广信息,成为所有信息化社会中的人必须面对的现 实。奈斯比特曾言:“失去控制和无组织的信息在信息社会里不再构成资源,相反,它成为 信息工作者的敌人”[2]。这说明,对信息组织的理论和方法的研究,无论是对于信息管 理者,还是对于信息用户都是十分必要的。

信息组织是由来已久的一种人类社会实践活动,是将无序的信息按其外部特征和内容特征 有序化,然后进行重新控制,其目的在于提供可控性的高效信息服务。图书情报领域的信息 组织工作可以追溯到古代的文献信息活动。

到了21世纪的今天,随着网络通讯技术的发展,出现了大量的网络信息,它们多以数据库 、超文本、多媒体的形式存在,电子型、数字型信息资源逐步占据网络时代的主导地位。随 着 网络信息数量的不断扩充,对网络信息进行有效的组织与控制的要求日益迫切,人们普遍感 受到由于网络信息杂乱无序而带来的检索困难。

在这样一种形势下,许多学者开始着眼于研究信息组织的理论,尤其对网络信息组织给予 了充分的重视,产生了大量有见地的文章。笔者希望对这些文献作一较全面的整理,对该领 域目前发展的状况进行必要的分析,以更好地促进这一领域的研究。

2 国内研究现状 关于信息组织的方法和技术的研究一直是图书情报界研究的重要课题。近几年,信息组织 的基础理论方面的研究得到了迅速发展,不断有对信息组织及其相关的情报组织、知识组织 的研究文章出现。

同时,随着计算机的普及、网络技术的发展及全球信息高速公路的建设,传统信息组织法 ,主要是分类和编目方法在网络环境下的发展和转变,以及网络信息组织技术的研究也日益 成为探讨的热点。

近年来,有关信息组织研究的内容大致可以分为以下几个方面:

①信息组织的理论研究,包括基本概念、组织方法、发展历史、基本原理和原则、研究对 象等。 ②信息组织的具体方式方法的研究,如分类法、主题法、目录组织法以及分类和编目在网 络信息组织中的应用等。

③网络信息组织技术的研究,包括元数据、搜索引擎、数据挖掘、在线翻译等。

下文将对这三个方面的研究现状作一介绍。

2.1 基础理论研究

在基础理论的研究方面,论文数量较少。《中国图书馆学报》1997年第1期上发表了宋彩萍 和霍国庆所撰写的“信息组织论纲”一文,文章对信息组织这一概念作出了明确的解释,认 为信息组织的理论基础应是信息系统理论、编码理论和逻辑理论,并借用语言学中的语法学 、语义学和语用学的含义将信息组织的方法分为语法信息组织、语义信息组织和语用信息组 织等三个层次[3]。霍国庆还在随后的几篇文章中继续深入地探讨了这一问题[4][15] 。同年,党跃武在“信息组织论”一文中,重点研究了信息组织的基本原则和发展历史,指 出信息组织工作中,必须坚持客观性原则、系统性原则、目的性原则和现代化原则,并将信 息组织的发展划分为三个历史阶段,即清册职能时期、查检职能时期和组织职能时期[16] 。1998年,尚克聪在《图书情报工作》上发表了“信息组织论要”,重点对信息组织的序化 方法和优化方法进行了研究,并对信息组织的地位和作用作了较详细的阐述[17]。总体上 来说,这些文章是对信息组织的概念、原理、方法、功能等多方面进行的较全面的论述,为 构架信息组织理论研究体系奠定了基础。但从这些研究论文来看,研究者们对信息组织理论 研究中的重要领域的认识不够统一,如对于信息组织的定义、理论基础、研究对象、发展历 史等问题都有不同的看法。

关于信息组织、情报组织和知识组织的关系探讨是信息组织基础理论研究领域中的又一重 要课题。王知津在其发表的多篇论文中提到知识组织这一概念,认为:情报组织往往被局限 在情报存贮与检索系统领域,有很大的局限性,不能适应信息社会乃至知识社会的发展,也 不能适应情报科学的发展;而知识组织能反映出社会发展的需求和情报科学的实质、目标和 任务,因此情报科学从情报组织到知识组织的发展和演变是必然的[8]。田书格认为,从 理论的高度来看,知识是高于信息的,知识比信息更具有系统性与概括性,利用已有的知识 可以开发出更多的未知信息成为知识,而广泛客观存在的信息没有知识的参与不可能成为对 人类有益的信息甚至知识,所以知识应取代信息成为富有生命力与发展空间的学科术语。同 样道理,信息组织和情报组织的术语概念也应得到扬弃,改为知识组织[9]。在国外知识 组织也是目前研究的一个热点问题[10][11]。不过笔者认为,知识组织的这一提法固然 有它的道理,但知识组织和信息组织是在不同层次上的组织,其研究对象及组织方法都有所 不同,因此不存在谁取代谁的问题。 1993年10月召开的第56届ASIS年会,其主题就是“信息组织的不同方法辩论”,这是信息 组织领域的一项非常重要的会议,会上对四种信息组织的研究方式展开了辩论。第一种方式 是客体范式,分析一般信息客体的性质;第二种方式是交流范式,研究信息查询、交流利用 ,考察人们如何构建信息提问和生成答案;第三种方式是行为范式,观察人们如何与潜在信 息源相互作用;第四种方式则是认知范式,研究人们如何思考以及模仿思考的规律[12]。 这标志着对信息组织方法论研究的重大成就。

2.2 方式方法研究

关于信息组织的具体方式方法的研究是最大量的,其中以分类法、主题法以及书目控制等 的研究体系最为庞大。事实上,自远古以来,人们就一直在对所积累的信息进行分类和组织 ,一代又一代的图书馆学家、情报学家甚至一生都在致力于这项工作,因此产生了众多的研 究成果。但我们应该看到,随着时代的发展,对信息组织传统方法的研究已日益减少,取而 代之的是对新环境下信息组织方法和技术的研究,这也是目前最具有生命力的研究课题。

首先,众多的研究者开始探讨传统分类法、主题法在网络环境下的转变。王忠红认为,传 统分类法的知识系统性和标识语言的通用性以及族性检索能力和扩/缩功能,是其他情报检 索语言所不具备的,也是无法取代的。因此,它在新的信息环境下也必然会有一席之地[13 ]。洪漪和梁树柏在“分类法在信息网络中的应用”一文中认为,随着信息网络的发展,占 据主导地位的分类法不可避免地会受到挑战,但与此同时也面临着新的发展机遇。分类法在 信息网络中的应用主要表现在用于联机浏览检索、非文本信息的组织、超文本系统的管理、 以及作为网络信息组织的通用工具并促进分类主题一体化[14]。强自力认为,使用分类法 组织网络 分类目录并提供浏览方式进行查询,具有直观、信息质量高等优点[15]。康桂英认为, 用主题词组织与揭示信息具有直接和直观的特点,在网络环境下有相当一部分网络信息资源 浏览器与引擎都以主题词为组织与揭示信息的重要途径与方法,由此可见,分类法与主题法 是各种网络信息资源最基本最主要的组织法与检索法[16]。从这些文章中可以看出,分类 法在网络信息组织中的重要地位是没有动摇的。

其次,在网络环境下如何实施网络信息的书目控制是研究网络信息组织的一个重要课题。 目录组织向来都是信息组织的重要组成部分,在当今网络环境下,其重要性仍然是非常突出 的。人们普遍认为网络信息资源急需象传统文献资源一样进行编目,并提供目录检索。朱蓓 认为目前对网络信息源的编目模式分为介入与不完全介入两种。前者完全由编目人员提供对 信息源的书目描述数据,后者的描述数据可由信息提供者、信息源的管理维护人员等多种途 径提供[17]。也就是说,一种方法是由编目工作者进行书目控制,另一种方法则是由信息 提供者在提供信息的同时提供信息的描述性数据。前者主要以USMARC格式的研究为主体,而 后者则主要以元数据的研究为主。

2.3 组织技术研究

搜索引擎作为网络环境下的重要的信息组织工具,自它出现之日起就倍受人们的关注,包 括图书情报界和计算机界以及信息产业界在内的众多学者对此展开了深入而有效的研究,由 此产生了大量的学术成果。目前对搜索引擎的研究主要集中在以下几方面:第一,对搜索引 擎的工作原理的研究;第二,对搜索引擎的评价指标的研究,以及对各种搜索引擎的比较研 究;第三,对搜索引擎目前存在问题的研究,如汉语自动分词的问题等;第四,对元搜索引 擎的研究。

其中1996年更被称为“搜索引擎年”,关于各种网络资源搜索引擎的介绍比比皆是。论及 的搜索引擎很多,包括:Alta Vista、Excite、Infoseek、Opentext、Webcrawler、Hotbot 、Look Smart、Yahoo、Sohoo、Megallan、UKPlus、Ultra等等,比较多的是对他们的使用 方 法进行介绍。另外,关于这些搜索引擎的优越性的评述也占有较大比重,主要从检索的全面 性、结果文献的相关性排序、检索方法的易用性、检索时效的快捷性、检索内容的多样性、 检索人口的丰富性等多个方面进行比较。一部分文献还对搜索引擎所面向的数据库作了讨 论,比较了诸多数据库的完善性及丰富性所在。随着网络的发展,对单个搜索引擎的介绍性 研究逐渐减少,取而代之的是对各引擎技术的对比分析,并更侧重于技术内核的研究,如元 搜索引擎、搜索引擎存在的不足等等。可以说,国内外对搜索引擎的研究已达到了相当丰富 的程度。

关于元数据的研究也是目前国内外研究的热点。随着网络的不断发展,网络信息资源正呈 不断增多的趋势,随之而来的问题是,人们发现在海量的信息环境下,信息的查找和检索变 得越来越困难。为了有效地解决查找网络资源这一问题,元数据这一概念被提了出来,创立 一个简单的并且在网络中为各个用户团体所接受的标准化元数据元素集,成了网络发展的迫 切需要。1995年3月在都柏林召开了第一届元数据研讨会,产生了著名的元数据集——都柏 林核心元数据集(Dublin Core),这次会议之后又召开了5次元数据研讨会,每次会议都对DC 进行了一定的补充和修订,使DC在结构和功能上逐渐地完善起来。由此在学术界也展开了对 元数据研究的热潮。

综合起来说,对元数据研究的内容主要包括:(1)元数据格式的介绍性研究;(2)对各种元 数据格式的比较研究;(3)关于元数据格式之间的标准化问题的研究;(4)元数据发展历史的 研究。国内对元数据的研究绝大多数停留在介绍的层面上,还不够深入。

事实上,信息组织技术的研究是十分广泛的,除了以上所提到的内容之外,有关网络环境 下的信息组织和服务的新技术如数据挖掘、自动摘要、在线翻译等都是需要深入研究的课题 ,这也是许多研究者正在研究的课题。

3 研究现状分析

总之,就目前的研究现状来看,一方面,成就是显著的,无论在信息组织的理论上或是实 践上均取得了一定的成果,但另一方面,也存在着不足的地方。

3.1 有关信息组织的理论研究系统性不够强,研究者也较少,缺乏统一的认识,对信息 组织所涉及的范畴划分不明显,无法判断信息组织究竟是指哪一方面。这反映出研究者对理 论研究的重视程度不够。

3.2 在信息组织方法的研究方面,应该说,由于长期以来分类和编目工作的实践,对分 类和编目的传统研究还是相当多的,但随着网络的发展,关于分类组织和编目组织在网络环 境下的转变以及网络信息的分类和编目的特殊性的研究日益显示出其重要性,对它们的研究 目前只是刚刚起步,研究得还不够深入,值得进一步发展。

3.3 有关网络信息组织的新技术的研究是目前的热点课题,尤其在搜索引擎、元数据、 数据挖掘、推送技术等方面更是产生了大量的研究成果。但我们也应该看到,对于这些新问 题的探讨目前只是停留在介绍性的层面上,大多数文献之间的重复性高,缺乏有创意的、深 入技术内部的研究,这说明关于信息组织技术研究的发展空间还很大,尤其对中文信息的组 织技术应更深入探讨。另外,有关其他技术问题也应该得到足够的重视。

3.4 缺乏对信息组织未来发展的展望性研究。随着网络环境的发展,新的分类模式和编 目模式得以产生,信息组织的理论和实践如何适应未来环境的发展值得我们去研究。

针对以上研究的薄弱之处,本文希望能够做到抛砖引玉,以期进一步充实信息组织领域尤 其是网络信息组织领域的研究。

标签:;  ;  ;  

信息组织研究述评_搜索引擎论文
下载Doc文档

猜你喜欢