数字信息资源的编目对象,本文主要内容关键词为:编目论文,信息资源论文,对象论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着数字图书馆建设的深入开展,越来越多的数字信息资源被纳入图书馆信息服务资源的范畴。这些资源有的以光盘、磁盘等物理实体形式被图书馆收藏,有的则以网络信息资源的形式为图书馆提供远程访问服务。同其他类型的信息资源一样,数字信息资源也需要经过整序加工,组织成书目数据库,才能方便、有效地为用户所利用。但数字信息资源的编目因其自身的特点与其他信息资源(如印刷型文献)又有差异,编目对象的确认便是值得探讨的问题之一。
1 面向对象的编目
“面向对象”概念是计算机科学为现代文献编目工作提供的又一有用工具[1]。把对编目对象的认识与识别作为编目工作的起点,使书目工具能够从揭示文献信息资源最本质的特征与相互关系的角度来满足用户的基本需求,这是现代文献编目工作区别于传统编目工作的一个重要特征。
国际图联颁布的研究报告《书目记录的功能需求》(简称FRBR)[2]用“实体-关系模型”(E-R模型)来描述编目对象,把作为编目对象的实体划分为著作(work)、表现方式(expression)、表达形式(manifestation)、文献单元(item)4个层次。著作是知识或艺术创作内容,是一个抽象的实体,必须通过一定的表现方式,如文字、图像、乐曲、舞蹈动作等,才能被人感知。表达形式体现知识或艺术创作内容的物理形态,如手稿、图书、期刊、录音制品、影片等;同一种表现方式可采用不同的表达形式,如某一版本的文字著作可以是印刷型的图书,也可以是缩微品或电子图书。文献单元是表达形式的某一物理实体,如图书馆收藏的某一本书或某一套多卷书。从以下实例我们可以对文献信息实体的4个层次有所认识:
著作:J.S.巴赫的Six suites for unaccompanied cello(6首无伴奏大提琴组曲)
表现方式1:1965年Janos Starker的演奏
表达形式1:1965年Mercury出版社出版的33 1/3 rpm唱片
表达形式2:1991年Mercury出版社出版的CD
表现方式2:1983年马友友的演奏
表达形式1:1983年CBS唱片公司出版的33 1/3rpm唱片
表达形式2:1992年CBS唱片公司出版的CD
著作、表现方式、表达形式、文献单元这4个层次都可以成为编目对象,确定哪一层次为编目对象与不同类型文献的目录学特征有密切的关系。对古籍中的写本、拓本来讲,其每一文献单元的物理形态乃至内容特征都可能不同,因此写本、拓本的编目对象可以是文献单元。对现代印刷型文献进行编目时,我们通常以“手头”的文献单元为代表,并假定同一表达形式(如印刷型文献的某一版本)的所有文献单元都是相同的,所以长期以来我们以文献的表达形式作为编目对象。但是当我们有这样一种物理形态,它能够把多种表达形式的知识或艺术创作的内容融合为某一表现方式时,那么以表达形式界定的编目对象便变得模糊不清了,这正是我们为数字资源编目时经常遇到的情形。
2 从一种替代物(surrogate)到另一种替代物
书目工具向书目使用者显示的对象并不是文献本身,而是揭示文献的物理与内容特征的书目信息,我们通过这些书目信息的有序组织,能够很方便地检查到所需要的文献。我们称文献的书目工具为文献的“替代物”(surrogate),它与它所代表的文献实体是分离的。将书目工具与文献紧密地结合在一起,在查检书目的同时能直接“阅读”(泛指对文献的使用)到文献,这是人们梦寐以求的理想境界。
早在上世纪40年代,美国情报学家Vannevar Bush就设计过把书目与文献融为一体的Memex系统[3],系统中存储的文献并非文献本身,而是文献的缩微复制品,可通过机械方式进行检索、复制。Memex系统虽未付诸实用,但它的设计理念却是现代超文本技术与数字图书馆的鼻祖。缩微技术把文本信息(包括一部分图像信息)存储起来,这是文献的另一种“替代物”,通过这种替代物,书目与文献可以紧密地结合在一起。当然缩微化文献的容量十分有限,而且主要涉及文本文献,对声音与动态的图像就无能为力了。如今人们已经创造出比缩微化文献更完美的替代物,即文献的数字化替代物,它不仅容量巨大,而且可以通过计算机网络传播到远方;不仅能转换文本信息,而且能转换声音、图像等各种信息。数字图书馆就是建立在这些数字化替代物(或称为数字信息资源)的基础上的。从某种意义上我们也可以说数字图书馆是文献信息资源的两种替代物——书目信息和数字信息资源的有机结合。
3 从表达形式到表现方式
文献的数字化替代物,或者说数字信息资源,能把各种表达形式的知识或艺术创作的内容融合为一种表现方式。比如某一音乐作品分别以录音带、光盘CD、唱片3种表达形式出版,这些表达形式都能转换成数字信息资源,并且对应于相同的表现方式层次。
前文已经提及,到底以4个层次的哪一层作为编目对象,是与一定类型的文献的目录学特征相联系的,也即由该类文献在某一层所能体现的目录学差异来确定的。所谓目录学差异是指特定条件下目录使用者感兴趣的书目信息的差异,如古籍写本、拓本在文献单元层次体现的差异,印刷型文献在表达形式层次体现的差异。现在我们遇到这样的情形,原先某一表现方式的音乐作品存在录音带、光盘、唱片3种不同的表达形式,因物质媒介的不同而在表达形式层次具有目录学的差异;但在数字化之后(比如都转换成MP3的格式),就其内容而言,物质媒介的差异己显得不重要,而在表现方式层次上,这3种表达形式的作品是完全相同的。这意味着,对数字信息资源来讲,该音乐作品的编目对象已上升为表现方式了。这里虽以音乐作品为例,对其他类型的著作而言也是一样的,如古籍的某一原本及其影印本与数字化版本。当然,某一著作的手稿与印刷本不仅在表达形式层次是不同的,在表现方式层次也是有差异的,因此它们的数字化版本对应于不同的表现方式。一般来讲,当著作的某一表达形式从一种物质媒介迁移到另一种物质媒介时,它的表现方式并无变化,而表达形式却改变了。这种物质媒介的转变对数字信息资源来讲是不敏感的,因为无论采用哪种物质媒介的原件,转变为数字资源后,其内容都是相同的,也即前文所说的,数字信息资源的编目对象已上升为表现方式了。
4 原件vs替代物
数字信息资源从其发布形式来分一般有两种类型:一种是发布时只有数字形式的原始数字信息资源(born-digital information resources),如数据库、应用程序、网页;另一种是将其他类型的文献数字化后形成的数字信息资源,可以称之为数字化信息资源(digitized information resources)。为原始数字信息资源编目时,其编目对象不难确定。数字化信息资源通常是其原件的替代物,即通过书目信息中特定字段或元素链接的数字化文献实体,其编目对象的确定目前有两种做法。一是以原件为编目对象,对物质形态及相关信息的描述以原件为依据;二是以替代物(即数字化信息资源)为编目对象,对物质形态及其相关信息的描述以替代物为依据。数字化信息资源的这两种确定编目对象的方法与缩微文献极其相似。尽管缩微文献的载体形态与相关信息可以按缩微后的形态来描述,但有人还是愿意按文献原件来描述有关的信息。同样,我们在网上用元数据描述某一印刷型的文献,然后用链接字段或链接元素(如DC的Identifier、MARC的856字段)引导到文献全文,而所谓“文献全文”只是文献本身的数字化替代物;我们未尝不可把文献的数字化替代物直接作为编目对象。其实缩微文献与数字化信息资源都具有大容量存储信息的特性,是文献实体的理想替代物;缩微文献在Memex系统中扮演的角色正是数字信息资源在数字图书馆中扮演的角色,所不同的是数字信息资源在一定存储空间容纳的信息量更大,转换的文献实体的类型更为丰富,几乎囊括文字、图像、音响、实物等一切信息载体。这是缩微文献望尘莫及的。
作为替代物的数字信息资源,其编目对象既可以是原件,也可以是替代物,或者说通常以表达形式界定的编目对象变得不稳定了,这种不稳定现象因数字信息资源本身的特征而凸现出来,成为我们对数字信息资源实行书目控制时不得不面对的问题。
有的编目学家已经注意到,文献的表现方式所对应的表达形式(或物理形态)不是唯一的,而且这些不同的表达形式提供了不同的书目信息[4],因此长期以来人们以文献的表达形式作为编目对象。但正如前文所分析的那样,数字信息资源的特征使表达形式的差异显得不那么重要了,因此有人提出“表现方式层”的编目方法。美国图书馆协会编目委员会在讨论AACR2的修订方向时,曾建议采用“基于表现方式的记录”(expression-based records),以下是这种记录的实例[5]。
Andrioni,James.
The simple analysis of the environmental Kuznets curve/James Andreoni,Arik Levinson.- Cambridge, MA:National Bureau of Economic Research,1998.
20 p.:ill.- (NBER working paper series;no.6739)
“Issued in September 1998.”
Formats issued:
1.[text]-22cm.
2.[electronic resotlrce]-Computer data(1 file: 154,00 bvtes)
System requirements:Adobe Acrobat reader.
Mode ofaccess:World Wide Web.
Electronic format type:PDF-File size:154,000 bytes-Electronic
location:URL:http://www.nber.org/papers/ w6739
上例中“20 p.:ill.”是文本的载体说明,放入 [text]项中更合适些。整个记录分成两部分,第一部分是表现方式层次的信息,第二部分是同一表现方式对应的不同的表达形式,此处是文本(text)与电子资源(electronic resouree)。在数字图书馆中文本一般是原件,电子资源通常是原件的数字化替代物。只要表现方式层次的信息是相同的,我们便认为信息资源的编目对象没有改变。
5 结束语
在对数字信息资源实行书目控制时,我们或者直接对原始的数字信息资源进行编目,或者间接地对非数字信息资源的数字化替代物进行编目。所谓“间接”,意味着通过元数据的链接机制所使用的信息资源实际上只是原件的替代物,但人们并不对原件与替代物在表达形式上的差异感到兴趣。
从确认编目对象的角度探讨数字信息资源的编目方法与技术可以认识到数字信息资源与其他类型的文献信息资源的差别,从而把握编目对象的适当层次,选择恰当的编目方法与技术。信息资源的数字化以前所未有的方式把各种载体形式的文献资源如此紧密地融合在一起,以致人们忽略了它们在物质形态上的种种差异,使我们有可能在表现方式的层次上描述数字信息资源。
在结束本文时,我们不妨再看得远一些。在数字图书馆中,著作的各种表现方式可以极其方便地链接在一起,甚至有些著作本身就是集声像、文字等表现方式于一身的“多媒体”,这是否意味着我们可以在“著作”层次上描述数字信息资源呢?这是值得进一步深入探讨的问题。