网络分类体系基本原理研究,本文主要内容关键词为:基本原理论文,体系论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
网络分类查询是因特网上用户常用的两种信息检索工具之一,对网上海量的混杂无序的信息起着积极的导航作用。国内外知名的综合性门户网站如Yahoo、Excite、Infoseek、搜狐、网易等都研制有自己的网络分类搜索引擎,提供网络分类浏览式查询。这些各具特色的网络分类体系给网上信息检索带来了极大的便利,但它们在类目设置、类目结构及排列等方面也存在着诸多不足,影响了这些系统的功能发挥,制约了其检索效率。网络分类检索的效率与其分类体系结构的科学性密切相关,因此,加强对网络分类基本理论的研究已成为一个重要的现实课题。本文试图从网络分类体系的原理和体系结构出发探讨网络分类体系的科学性,并针对现有系统存在的问题提出改进策略。
1 网络分类体系的基本原理
1.1 网络分类体系是典型的分类主题一体化分类法
网络分类体系不同于传统分类法,它是现代网络环境下为满足用户网上检索信息需要而开发的新型分类体系。由于网上信息资源与文献信息资源有着较大的差异,不仅范围广,而且类型复杂、变化不定,网络用户需求各异、素质参差不齐,而传统分类法是建立在印刷型文献基础上,用分类号标识概念,分类体系结构以严格的学科分类和逻辑基础线性排列,缺乏直观性、实用性、易用性和动态容纳性,这就使得用传统分类法来组织网络信息存在着难以弥补的缺陷。
分类是人类惯用的思维方式,人们在搜寻事物时通常把事物归于特定类目以获得指引。网络分类体系遵循传统分类法层层划分、从总到分逐级展开的基本思路,主题或概念的划分基本运用逻辑划分规则,但其列类主要从事物主题概念出发,类目的设置是以主题或主题与学科相结合的形式,用直观的语词(自然语言或受控的自然语言)取代传统分类法的号码标识,类目排列上也不仅运用系统性排列,同时也采用主题字顺、频率排序等方法。网络分类法的这种集分类体系结构与主题标识于一身的特性使它成为真正的分类主题一体化的检索语言。
1.2 网络分类体系以快速检索信息为惟一功用
传统分类法的编制主要针对印刷型文献的特点用以编制分类目录和组织分类排架,而网络分类体系旨在为网上信息提供指引,建立与目标信息的快速有效的链接。网络分类体系应面向广大网络用户而不是图书情报专业人员,从这个意义上来讲,面向网上用户需求应成为在编制网络分类体系时的指导思想。其类目体系在体现科学性的同时,更要满足实用和易用的要求,列类时往往将贴近社会和生活的常用主题从其类族中单独出来,类目展开时常用多元划分、多重列类,并用超链接揭示类目的横向关系。
2 网络分类体系的基本结构
2.1 大类结构
大类是网络分类体系的大纲,是支撑整个分类体系的框架,也是面向用户检索的最初的公共检索入口。大类类目体系是否完善,类名涵义是否清晰,类目设置是否实用,在很大程度上影响着网络分类检索工具的检索性能。一般来讲,大类体系要遵循下列基本原则:
2.1.1 大类的类目设置要能覆盖人类全部知识及信息领域
作为综合性检索工具,大类类目体系要使网上任何信息资源不论是什么内容、什么类型都应有面向用户的合适的分类检索入口。不仅要有人文社会科学、科学技术等类目的设置,与生活密切相关的教育、娱乐、旅行、健康等都要有相关类目的设置。知识领域不全是大类设置常见的缺陷。
2.1.2 基本反映网络资源内容的整体分布状况
大类作为一级类目,应保证有丰富的所属网络资源。因此大类的选用要根据资源状况,资源相对较少的宜选用宽泛的主题及学科作为类目名称,如“科学技术”;资源丰富的而又常用的类目也可用较小的主题作为类目名称,如“计算机与因特网”。
2.1.3 类目的设置宜采用主题与学科相结合的方式
网络分类体系摒弃了传统分类法以学科为中心列类的思想,但也不宜完全采用主题设类。因为主题一般指向某一具体对象,即使是最宽泛的主题词,其类目体系的容纳性也是有限的。从大类要全面反映知识信息领域来看,大类设置如果结合适当的学科聚类(特别是在反映学术资源时),不仅可以增加包容性,而且可以使整个体系更加系统,甚至可以提供更多的检索入口。
2.2 类目的划分
类目的划分是构筑分类体系的基础,其核心问题是分类标准的选择和运用,网络分类体系从方便用户检索出发采用了以多元划分和多重列类为主的类目划分体系。
2.2.1 多元划分
它指的是在类目展开时采用多种划分标准列类。传统分类法由于要针对排架集中文献,同一类文献只能有惟一特定位置,只能一次采用一种标准,有多种标准时还要考虑引用次序。而网络分类体系则可以不拘泥于这些束缚,可以从用户实用性、方便性出发,同一级类目可能采用主题、学科、资源类型、国别、时代等多种标准。多元划分有效地缩短了分类体系的级次,减少了换屏次数,突出贴近生活、社会、时代的常用类目资源,节省了检索时间,给用户带来了极大的便利。
2.2.2 多重列类
网络分类体系的另一大特色是多重列类的广泛采用。由于任何事物都具有多重属性和多向成族的特点,采用多重列类可以将同一类目多次重复反映,适应了用户的不同的思维方式,达到通过多个入口及路径检索到同一目标信息的目的。多重列类包括两层含义。一是从类表展开的整体来看,同时使用不同的引用次序,多维地展开类目体系。它并不刻板地遵循一致的引用次序,采用“主题—地区”、“主题—文献类型”、“地区—主题”、“形式—主题”等多种形式。二是在特定类目划分时改变传统分类法只采用一种主要的分类标准运用次序而采用多种次序重复反映。如《中图法》在文学列类时只采用了“国别—时代—体裁”的列类次序,而网络分类体系可同时采用“体裁—国别—时代”、“国别—体裁—时代”、“国别—时代—体裁”等多种列类次序。
2.3 类目名称规范
类目名称是指分类体系中标识一类事物或某一主题的“语词”。由于类名是人们判断类目概念内涵与外延进行检索的依据,因此类名是否科学,是否符合人们认识事物的规律关系到网络分类体系的使用效率。类名的选用必须符合下列各点要求:
2.3.1 确切
类名要能准确地概括类下所属的全部资源,易于理解,不能含糊不清,引起歧义。现有的网站分类体系中,从贴近生活的角度,变传统分类法的命名科学性和学术性为通俗词汇,但同时也出现大量的“类名不确切”的类目。如网易出现“围城内外”、“宽带生活”、“另类科学”等类目叫许多人难以准确地判断其内涵,这样的分类体系很难有较高的检索效率。
2.3.2 科学
即要采用比较常见的正式的名词作为类目名称,而不要采用不通行的同义词、俗称、旧称、不能准确表现全称原义的简称、不通行的译名、近义词等作为类目名称。如宜用“计算机与因特网”而不用“电脑与互联网”,用“通信”而不用“通讯”。作为面向大众的检索工具应使尽可能多的用户更易理解使用,同时也符合分类体系的相对稳定和长远需要。
2.3.3 简洁
类目名称所用词或词组要概括精炼,要在准确表达类目含义的前提下尽可能简洁。对较长的词语可选用其通行的含义的简称,如“广西壮族自治区”宜用简称“广西”。
2.4 类目的排列
类目的排列是指同位类目的排列次序,其目的是使类目的排列能体现类目之间的联系,符合人们的思维习惯,并突出常用的重要类目资源,以提高分类体系的检索效率。网络分类体系中常见的排序方式有三种。一是按系统排序。它是根据类目之间的内在联系排列,列类次序反映客观事物本身的发展和联系。如“教育”类按“学前教育”、“初等教育”、“中等教育”、“高等教育”从低级到高级排序。二是按频率排序。在排序时参考类目被使用的频率把常用的频率高的类目排在最前,频率低的靠后。如“体育运动”的各类中,可把深受人们喜爱的“足球”、“篮球”、“围棋”等排在前列,以方便用户检索。三是按字顺排列。字母语言可按惯有的字母序列列类,汉语按汉语拼音或笔画、笔顺等字顺排列。
网络分类体系中类目的排序应采用按系统性排序为主,辅之以按频率排序和按字顺排序的方式。因为按系统排列可以揭示事物固有的内在的联系,符合人们的思维习惯和认识发展规律,用户可以触类旁通,很方便地查到相关类目,而且有利于族性检索,如“教育”类下有些网站不列“学校教育”,但可通过排在一起的“初等教育”、“中等教育”、“高等教育”等类目来完成。按频率排序把重要的常见的类目排在前列符合分类体系实用性和快速检索的要求。按字顺排序属于人为系列,虽有严格顺序,但割裂了类目的联系,只宜在数目较多而且类目间联系不强时采用,如“国家和地区”可按字顺列出其众多类目。
2.5 横向关系揭示
网络分类体系的横向关系包括多属类目和相关类目。由于事物具有多向成族的属性,同一类事物可以分属不同的学科、主题或资源类型等相关类目,如“中国足球”既可以是“体育运动”下的相关类目,也可以列于“国家和地区”类目之下。与传统分类法通过交替类目,增加注释和完整的类目参照体系来揭示横向关系不同,网络分类体系主要使用链接的方式,在相关类目之下重复反映,同时采用@号来表示本类目为重复反映类目。网络分类体系中需要揭示的多重关系有:多属性主题、交叉学科、边缘学科、总论与专论、资源形式与主题、地区与主题、人物与相关类目等。现有的网络分类体系在横向关系揭示上也存在一些不足之处。一是整个体系中多重列类重复反映运用不够,没有形成密集的类目关系网,造成用户习惯性检索入口的缺失。一些本该集中列类的类目分散在各个专论类目之下,缺乏必要的协调。二是多重列类时存在列类随意、逻辑隶属关系混乱的情况。如“东方网景”把教育列于自然科学类目之下,Yahoo把“音乐”放在“综合参考”下重复反映, 这样做很难达到增加检索入口的预期效果,徒增分类体系的篇幅而已。
3 网络分类体系的多样与统一
在我国,许多综合性网站都有自己的网络分类体系,这些不同网站的分类体系的大类设置与划分、类名的表述与外延、类目的排列等各不相同,检索性能也有较大的差异。不少学者研究网络分类体系时,从多样的分类体系造成用户理解和运用困难影响知识组织和信息交流出发,认为有必要尽快建立我国的统一的网络分类法来组织网上丰富的信息资源。也有学者从网络资源动态性出发认为人为地追求统一没有必要。统一的分类法,到底有无必要,笔者认为网络分类体系应是多样性的统一。在统一网络分类体系基本原理和大类结构的基础上,保留并改进现有的多样的网络分类体系。
3.1 网络分类体系类目应是动态性与相对稳定性的统一
传统分类法统一的体系结构造成难以适应新学科发展的需要,虽一再修订仍差强人意。网络环境下,社会的发展瞬息万变,在我们的身边不断有新的“热点”名词,也有不少曾经时尚的事物走向没落,网上各类资源数量的内部整体构成也是经常变化的。同时,网络信息资源不同于印刷型文献资源,不具有物理实在性,可能随着网页的更新因缺乏保存而消失,网站也可能不复存在。因此,从这个角度来说,网络分类体系的类目不宜固定不变,而应根据网络资源和用户现实需求面随时作出调整。但网络分类体系的动态性应是局部的、阶段性的调整,而不应出现剧烈的变动,否则,会造成人们认识的混乱,从而影响检索的效率。
3.2 网络分类体系应是多样性的统一
它是指针对现有多种网络分类体系共存的现状,在统一网络分类体系基本原理和大类结构的基础上允许多种有特色有实力的分类体系共存发展。不同的网络分类体系在类目体系和资源选择上往往都有自己的特点,使其在满足不同用户需求或检索特定资源时有其独到之处。网络环境下,用户的需求日益个性化,特定的用户以及用户在特定的时期其需求是不同的。而个性化服务需要有个性化的资源选择和组织形式。此外,多样性必然导致网络分类体系之间的竞争,为了取得用户上的优势,开发者不得不针对用户的需求实时地改进,这就使得整个网络分类体系的性能得到自然的提升。较之于《中图法》庞大的管理和维护机构及滞后的修订机制,其好处是不言而喻的。当然,多样性并不是提倡差异,而是就特色而言。一般来说,用户并不总是运用同一网络分类体系,不同的网络分类体系如果在列类思想、类名及其涵义等方面有较大差异,会造成用户理解和运用的不便。因此,网上各种分类体系有必要在其编制原理、类名规范、类目划分及排列,横向关系提示等方面达成一致。类目的级次越高,稳定性也应越强。由于网络分类体系的大类体系代表着人类全部知识信息领域的整体框架,同时又是用户检索的最初入口,因此大类结构不宜经常变动,应保持较高的稳定性。二级类目以下可以根据用户需要有控制地动态设类,使分类体系能及时反映用户需求和资源的变化,加强类表的适用性。