资源共享中的机读书目数据_人文论文

资源共享中的机读书目数据,本文主要内容关键词为:资源共享论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

用计算机进行编目的初衷是为了减少重复劳动,以节约人力资源,而marc的引入又使编目工作变得复杂化。要解决这一矛盾,只有编目数据实现共享。北京图书馆从1990年开始发行机读的国家书目数据[1],1949-1999积累了100余万条[2],这些数据的发行对当前大批图书馆回溯建库起了很大的作用,一方面减少了大量工作;另一方面数据库质量得到保证,而这正是建库时最困难的两个方面。它还对marc著录标准化起到推动作用。

回溯建库与新书编目对书目数据的利用不同,前者要求主要在数据的网罗度。而新书编目除网罗度外,还要求数据具有时效性。在新书编目中,国家图书馆发行的书目数据使用情况如何,今后发展趋势怎样,下面谈谈本人对问题的认识。

从1997年我馆开始订购国家图书馆发行的书目数据用于新书编目。开始是全年发行的都定购,成本太高,后采用对每批书的ISBN号扫描后套录的方式。下面是1999年10月开始至2001年7月我馆套录书目数据情况的统计:

间隔天数命中率类别

8674%

科技

2854.34%科技

2861.50%人文

1045.28%科技

137

88.68%科技

139

84.28%科技

114

70%

科技

4083.76%科技

2972.53%科技

6169.26%科技

4264.52%科技

1999.10 133

76.09%科技

111

66.67%科技

1780%

人文

8954.29%人文

107

63.55%科技

2001.01 6279.31%人文

106

83.5% 科技

7673.33%人文

5575.51%人文

7752.08%科技

2966.67%人文

8978.87%科技

5173.50%人文

3146.04%科技

5385.83%人文

6173.05%科技

5764%

科技

4083%

人文

合计间隔天数命中率命中率/间隔天数

类 科技78.7 69.22%0.88%

别 人文49.3 72.5% 1.72%

全部 67.5 70.46%

左表的样本数据统计表明:

(1)1999年10月至2001年7月,平均间隔天数(书到馆与数据套录之间的时间间隔,)为67.5天,平均命中率为70.46%(另2000年底有一批积累了一年的赠送书,有部分非正规出版物,该批书进行套录因无法计算间隔天数故未加入统计,它的命中率只有36%,将这些因素考虑进去平均命中率会降低。)

(2)人文类(中图法A——K类)间隔天数为49.3天,命中率为72.5%,命中率与间隔天数之比为1.72%;科技类(中图法N——Z类)间隔天数为78.7天,命中率为69.22%,命中率与间隔天数之比为0.88%。可知,人文类命中率高于科技类。

(3)我馆是医学图书馆,也是一所大学图书馆,图书的收藏以生物学、医学为特色,并包括人文科学、数理化、计算机及各类工具书。从上数据中得知,我馆以生物、医学为特色的科技书最高命中率可达88.68%,表明国家图书馆书目数据具有较高的网罗度,连专业书亦有令人满意的命中率。

(4)表中数据还表明,命中率跟书到馆后进行套录的时间间隔有关,时间间隔越短,命中率越低。其中间隔时间最低的10天,命中率仅为45.28%,这表明数据存在滞后问题。

从表中数据可看出,间隔时间与命中率的数据之间不是简单的线性递增关系,那么具体是什么?下面用回归分析法对间隔天数与命中率进行分析。所谓回归分析是指对相关变量进行测定并据以进行估计和预测的统计方法。按照一般的认识,间隔天数为已知量,取为自变量X,命中率是个未知变量,取为因变量,回归方程如下:

Y=b0+(b1×ln(X))

使用SPSS软件对数据进行回归分析,得到图形如下所示:

从上图可以看出,回归曲线反映了命中率与间隔天数的变化趋势。当间隔天数较小的时候(<40天),命中率的提高幅度比较大,曲线在这部分比较陡;当间隔天数达到较高水平时(>80天),即使大幅增加间隔天数,也不能显著提高命中率,曲线越来越平,最终平均命中率将大致稳定在80%以下,即目前的方法下平均命中率无法突破80%,这与前面统计的70.46%的平均命中率相吻合。据有关报道,“利用美国国会图书馆书目的数据进行套录,命中率为85%”[3],而“OCLC向其成员馆提供94%的书目数据”[4]。与此相比,存在差距。

从上两种统计分析可知,目前利用国家图书馆书目数据进行套录命中率高低主要取决于数据是否及时,其次是数据的网罗度。50年代末北京图书馆等为实现书目共享组成中文编目组,向全国发行图书目录卡片,几经变更,80年代达到鼎盛时期。当时正值文献著录一系列规则、标准出台,这种集中编目的卡片,对当时编目标准化起了巨大推动作用。随时间的推移,文献数量的增加,出现卡片提供的种类不足,尤其卡片到馆滞后于图书到馆的现象。目前,新书套录国家图书馆书目也面临数据滞后问题。但世界在进步,计算机在图书馆中的应用,尤其是网络的出现,给问题的解决提供了更好的选择。网络环境下的编目出现一种新方式——合作编目,它是解决数据滞后和网罗度问题的最佳模式,能以更少的工作获得更大的利益。如何组织合作编目,笔者认为合作编目必须以集中编目为基础,才能保证编目质量。集中编目的长处在于充分利用部分人的编目技术,目前北京图书馆承担了国家图书馆的职能,它在各方面的力量在全国是首屈一指的,应充分发挥其技术力量。从它发行的数据来看,尽管有些数据处理不一致,而且作为国家图书馆,著录详简级别有待提高外,其编目质量有目共睹,特别是考虑到目前数据量达100万之多。“在美国合作编目蓬勃发展的今天,美国国会图书馆编目部作为集中编目中心的作用仍是举足轻重的。OCLC身为当今世界上最大的图书馆现代化网络,它本身并无编目职能,其书目数据库中的绝大部分数据都来自美国国会图书馆。”[5]美国的这种模式值得借鉴。目前我国以系统、行业、地区来组织进行合作编目的机构不少,重复劳动以另一种形式出现。网络的出现对图书馆提出了新的要求,我们应该认识到,充分利用国家图书馆的人力资源,可令各图书馆能将宝贵的人力资源用于网络环境下图书馆面临的新问题,要承担的新任务。

标签:;  ;  ;  ;  

资源共享中的机读书目数据_人文论文
下载Doc文档

猜你喜欢