我国机读目录格式的缺陷与改进_无损检测论文

我国机读目录格式的缺陷与改进_无损检测论文

中国机读目录格式的缺陷及改进设想,本文主要内容关键词为:中国论文,缺陷论文,格式论文,目录论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

近年来,随着网络化数据交流的普及应用和数字图书馆的崛起,元数据及与其相关的标准日益引人注目,而传统的机读目录格式在图书馆的论坛上越来越受人冷落,似乎应该遭到淘汰的命运,而让元数据取而代之。笔者认为这种观点有失妥当,在图书馆的未来发展中,机读目录格式应该和元数据共同存在、共同发展。

1 中国机读目录的历史及存在的必要性

MARC英译为“机器可读的目录”,也称机读目录,起源于1965年的美国,是计算机能够识别和阅读的目录。机读目录格式是图书馆编目规则与计算机磁带存储格式的结合,而图书馆编目规则是图书馆长期工作的经验总结。国际图联推出了UNIMARC格式,将内容标识符标准化。我国于1979年成立全国信息和文献标准化技术委员会;于1982年出版了《文献目录信息交换用磁带格式》(GB2901-82),为中文MARC格式标准化奠定了基础;1991年《中国机读目录通讯格式》正式出版,即CNMARC,中国的CNMARC是遵循等效采用UNIMARC格式的原则,它基本上译自UNIMARC。CNMARC采用的是国际标准书目(International Standard Bibliographic Description for Electronic Resources),即ISBD的规则。

CNMARC的产生,在我国的图书馆史上具有重大意义。它推进了中国书目数据的规范与统一,加速了文献信息网络的建设,实现了国内务单位之间及国内与国外之间的书目信息的交换与共享。

编制MARC数据是图书馆数字资源建设的重要组成部分,是图书馆自动化、现代化的基础,所以在现代化的图书馆的管理中占据非常重要的地位。目前,我国各个使用计算机编目的图书馆虽然所使用的图书馆软件不同,但一般都是依照CNMARC格式进行编目的。

CNMARC格式是我国目前处理书目数据的最佳方式,而元数据及相关标准主要是针对网络信息的组织与管理,二者并不矛盾,如果排斥CNMARC,我们就无法将书目记录与数字图书馆结合在一起,所以CNMARC的存在是非常重要的。

2 中国机读目录存在的缺陷及改进建议

2.1 在CNMARC著录中加入汉语拼音缩写的问题

CNMARC主要有以下三个版本:1991年根据1987年UNIMARC格式制订的《中国机读目录通讯格式》;1995年根据1994年UNIMARC制订的《中国机读目录格式使用手册》;2001年根据最新UNIMARC格式制订的《中国机读目录格式使用手册(修订版)》,可以看出CNMARC是随着UNIMARC的发展而不断修改完善的。中国机读目录格式基本上满足了对各类型出版物的描述需要,但以上三个版本及其它的版本在对出版物的描述中都缺少对题名的拼音缩写款目。汉语拼音缩写是在日常生活中被人们普遍使用而且使用起来非常方便的一种计算机检索方式,很多应用软件在设计时都考虑到这一点,比如用网络实名查找网页时可以在地址栏中输入网站的拼音缩写、使用股票软件时也可以用股票名称的拼音缩写来查找股票、医院的医生在用电脑配药时,也是输入药名的拼音缩写来选择药名的。但是,在CNMARC中却缺少对出版物题名的拼音缩写子字段,题名的拼音缩写不能作检索点,这不能不说是CNMARC存在的一项很大的缺陷。

有很多图书馆从实际工作出发,在MARC的编制中加入了题名的拼音缩写款目。那么,如果把题名的拼音缩写作为一个子字段,在目前的CNMARC中放在哪个位置比较合适呢?这是一个非常需要探讨的问题。

笔者认为题名的拼音缩写作为一个子字段必须要满足以下条件:

①要能生成检索点。

②能够在题名项(而不是其它项)的检索窗口中被检索到。

③因为某些出版物存在不只一个题名,所以这个子字段是可以重复的。

④要基本附合ISBD的规则。

CNMARC的200字段是题名与责任说明字段,它与ISBD的题名及责任说明项相对应。200字段包括以下子字段:

子字段标识符 子字段内容 注释

$a

正题名 必备,可重复

$a(重复)

同一著者的不同正题名

可重复

$b

一般资料标识

可重复

$c

另一著者正题名 可重复

$d

并列题名

可重复

$e

副题名及其它题名信息

可重复

$f

第一责任说明

可重复

$g

其余责任说明

可重复

$h

分辑号 可重复

$i

分辑名 可重复

$z

并列题名语种

不重复

$v

卷标识 可重复

$A

正题名汉语拼音码

可重复

在200字段中,$a子字段的数据通常用于生成属于该记录题名的检索点。

题名的拼音缩写作为检索点要在题名项(而不是其它项)的检索窗口中检索,那么它其实是被当作题名来检索的,所以也可以把题名的拼音缩写看作是题名,而它又要被作为一个检索点,那么就应该放在200字段的$a子字段中,即著录时在$a正题名项后再加上$a正题名的拼音缩写。同样道理,$f第一责任者后面也可以再加上$f第一责任者的拼音缩写,这样第一责任者的拼音缩写也能生成检索点。

把正题名的拼音缩写当作正题名来著录,总是有点牵强,在修订CNMARC新的版本中,应该考虑将题名和责任者的拼音缩写设成专门的子字段。

把题名的拼音缩写作检索点方便了书目数据的检索,非常具有实际意义:

(1)在图书馆的工作中使用非常方便,会大大提高工作效率。在图书编目时要用题名对图书进行一次查重,如果用题名的拼音缩写来查重的化会方便很多;在期刊工作中,工作人员在每天对新刊记到时,用题名的拼音缩写查找刊名比起用其它的检索方法要方便很多。

(2)方便读者检索。这一点是勿庸置疑的,输入汉语拼音缩写当然比输入汉语要方便得多,而且,有很多年纪比较大的读者不会汉语的输入。

每年图书馆都要加工几万到几十万册新书,工作量非常大,在设计图书馆软件时,应该考虑加入机器自动生成题名的拼音缩写功能,就象现在的200字段的$A子字段一样,只要输入题名便可以由机器自动生成。

2.2 题名的拼音缩写在更名期刊的著录中的使用

CNMARC还有一个很大的缺点,就是著录非常复杂,尤其对更名期刊的著录,而加入了题名的拼音缩写子字段就能使更名期刊的著录变得简单,而又不会影响检索结果。

我国的期刊更名情况非常普遍,在CNMARC中对更名期刊进行著录,是采用“分段反映式”,即期刊更名后,按更名前后刊名分别著录,通过各自款目的相应字段来反映与其相关联期刊的关系,比如430(继承)、431(部分继承)、432(替代)、433(部分替代)、434(吸收)、435(部分吸收)、437(分自)、440(由……继承)、441(由……部分替代)、442(由……替代)、443(由……部分替代)、444(并入)、445(部分并入)、446(分成……,……和……)、447(与……,……合并而成……),上述字段用于实现所编连续出版物与其先前题名的连接,同时在附注项中对这种关系作进一步说明。

期刊的更名大致可以分为三类:单一更名、分出更名、合并更名,下面笔者就每一类说明标准的CNMARC著录,需要说明的是以下各例中省略了指示符和与本文论述主题无关的其它字段、予字段。

(1)单一更名,指一刊更名为另一刊,它有二种情况:

①更名后卷、册号相连,对于新刊,在430字段著录原刊名,再在附注项说明刊名变化情况;对于原刊,在440字段著录新刊名,在附注项说明刊名变化情况。

②更名后另起新的卷、册号,对于对于新刊,在432字段著录原刊名,再在附注项说明刊名变化情况;对于原刊,在442字段著录新刊名,在附注项说明刊名变化情况。

(2)分出更名指一刊分成二刊、三刊或三刊以上,对于新刊,应在第一种新刊名的431字段著录先前期刊的刊名;对于原刊,应在441字段著录所分出的刊名。

(3)合并更名是指二本期刊合成一刊,它有二种情况:

①以平等地位合并的更名期刊,对于新刊,在436字段著录被合并期刊的刊名,每一种刊使用一个436字段;对于原刊,在447字段著录同本刊合并的其它期刊及新形成期刊的刊名。例如:《水利水电》与《中国水利》合并而成《水利水电建设》

1)新刊的标准著录为:200字段著录$a水利水电建设

436字段著录$a水利水电

436字段著录$a中国水利

产生的附注为:本刊由:《水利水电》,与《中国水利》合并而成

2)原刊著录格式为:200字段著录$a水利水电

447字段著录$a水利水电建设

产生的附注为:本刊与《中国水利》合并,形成;《水利水电建设》

②以不平等地位合并的期刊,即一刊被另一刊吸收,对于吸收方,在434字段著录被吸收期刊的题名;对于被吸收方,在444字段,著录所并入期刊的题名。

例:《无损检测》吸收《国外无损检测》,仍以《无损检测》出版

1)吸收方的著录为:200字段著录$a无损检测

434字段著录$a国外无损检测

产生的附注为:吸收《国外无损检测》

2)被吸收方的著录为:200字段著录$a国外无损检测

444字段著录$a无损检测

产生的附注为:并入《无损检测》

从上可以看出在CNMARC中,对于更名期刊的著录非常复杂,而且专业性太强,工作人员著录时很容易出错。加入了题名的拼音缩写子字段,无论出现以上何种情况的期刊更名,著录方法都是一样的。著录时对于新刊:在200字段著录新刊名和新刊名的拼音缩写,再著录原刊名的拼音缩写,然后再在附注项具体说明更名情况;对于原刊:在200字段著录原刊名和原刊名的拼音缩写,再著录新刊名的拼音缩写,然后再在附注项具体说明更名情况。这样就可以省略430、431、432、433、434、435、437、440、441、442、443、444、445、446、447字段。在题名项窗中检索时,不管用哪一个刊名的拼音缩写检索,新旧刊名的MARC都会出现在检出的结果中。

例如:在2.2部分第(3)例①中,新刊:200字段著录$a水利水电建设$aslsdjs$aslsd$azgsl

产生附注:本刊由:《水利水电》与《中国水利》合并而成

原刊:200字段著录$a《水利水电》$aslsd$azgsl$aslsdjs

产生的附注:本刊与《中国水利》合并,形成:《水利水电建设》

原刊:200字段著录《中国水利》$azgsl$aslsd$aslsdjs

产生的附注:本刊与《水利水电》合并,形成:《水利水电建设》

这个例子中省略了436、447字段,而且用更名前后的任意一个题名的拼音缩写检索,以上三条MARC记录都会出现在检出的结果中。

在2.2部分第(3)例②中,吸收方:200字段著录$:无损检测$agwwsjc

产生的附注为:吸收《国外无损检测》

被吸收方:200字段著录$a国外无损检测$agwwsjc

产生的附注为:并入《无损检测》

这个例子中省略了434,444字段,用任一题名的拼音缩写检索都会检出以上二条记录。

有的期刊不只一次更名,有过两个以上的刊名,也是一样著录,在200字段中要加上所有刊名的拼音缩写。把上面的例子对比,可以看出加入了题名的拼音缩写子字段著录起来比用标准的CNMARC格式著录简单多了,而且检出的结果和用标准的CNMARC著录是一样的。

目前,随着我国的计算机技术的日益成熟,图书馆正在迅速推进数字化、信息化建设,由CNMARC处理的书目数据作为数字图书馆的一部分,为广大读者获得书目信息提供了多种检索途径,使读者获取信息和知识的能力得到了提升,但CNMARC的局限性和不足之处也在实践中越来越暴露出来。任何事物都是发展的,没有变化和创新的事物会被历史淘汰,CNMARC也是一样,只有在实践中不断修改加以完善,才能适应时代的发展。

标签:;  

我国机读目录格式的缺陷与改进_无损检测论文
下载Doc文档

猜你喜欢