书目合并后的数据覆盖与损失分析_大数据论文

书目合并后数据覆盖与丢失现象分析,本文主要内容关键词为:书目论文,现象论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

院校合并是20世纪末我国高校改革重要举措之一。随着院校的合并,图书馆合并后,为充分地实现资源共享,其书目数据也必然进行合并。北华大学是由吉林师范学院、吉林医学院、吉林林学院和吉林冶金电气化专科学校合并而成的一所综合性大学。学校合并后,图书馆也进行了实质性合并,选用“博菲特图书馆自动化系统软件”(PFT)作为系统管理软件,进行书目数据合并。本文就在合并后的一年多的工作实践中,所遇到的数据覆盖与丢失现象进行了分析,并针对其产生的原因提出相应的改进建议。

1 数据覆盖与丢失现象

1.1 旧数据覆盖新数据现象

索书号一致的两种不同图书,在典藏时发生新著录图书的书目数据被旧的书目数据所覆盖现象。如:《楚辞译注》与《屈赋新笺·离骚篇》两种图书的分类号均为I222.3,新入藏的《楚辞译注》编目后由系统自动给出8为种次号,与已入藏的《屈赋新笺·离骚篇》一书种次号相同,这样两种图书的索书号均为I222.3/8。书目数据传送给典藏后,新著录的《楚辞译注》一书的书目数据被已入藏的《屈赋新笺·离骚篇》的书目数据所覆盖,图书的登录号仍为《楚辞译注》一书的登录号,出现了旧数据覆盖新数据的现象。致使《楚辞译注》一书,因数据被覆盖而不能进行典藏。其主要表现为系统为新分编图书分配了一个数据库中已经存在的种次号,致使两种不同的图书具有了相同的索书号。从而产生书目数据传递后,新书的书目数据被旧书的书目数据所覆盖现象。

1.2 条形码号丢失现象

在图书借阅时,系统提示被借图书的条形码号不存在,因此图书不能借阅。条形码号丢失现象在流通系统中表现为两种形式:(1)单纯条形码号丢失。即在图书借阅过程中,系统揭示被借图书的条形码号不存在,通过正题名及索书号查找后,均能找到该书的书目数据,丢失的只是该种图书入藏时间较早复本的条型码号,而入藏时间较晚复本的条形码号仍然存在。其表现为二次进馆的图书,其旧复本的条形码号被新入藏复本的条形码号所覆盖,致使条形码号丢失而不能借阅。(2)书目数据完全丢失。即在图书借阅过程中,系统提示被借图书条形码号不存在后,利用正题名查不到该书的书目数据;而通过索书号查找时,可找到一种或一种以上索书号相同的书目数据。其表现为索书号相同的几种图书的数据同时存在时,在书目数据库中就可能造成一种或一种以上的书目数据库的丢失现象。

1.3 登录号丢失现象

在编目系统卡片打印时,新分编图书的登录号丢失。如:《童年的许诺》一书为二次进馆,对入藏的新书进行数据加工后,卡片打印时,在“详细信息”上只有第一次入藏图书的登录号,出现了新分编图书登录号的丢失现象。

2 产生数据覆盖与丢失现象的原因分析

在上述的数据覆盖与丢失现象中,无论是哪一种情况,都有一个共同的表现特征,即覆盖或被覆盖图书的书目数据都具有相同的索书号。这为我们对产生书目数据覆盖与丢失现象原因的分析提供了重要的线索。即所有能够产生相同索书号的因素,都可能与书目数据覆盖与丢失的原因有关。

2.1 书目数据合并存在的问题

院校合并前,由于原各校图书馆的书目数据库建设是分别进行的,各馆之间的书目数据难免存在同书异号和异书同号现象。随着院校的合并,图书馆在对书目数据进行"1+1"的数据合并后,这种书目数据的同书异号和异书同号现象,在合并后的书目数据库中就成为了一个十分严重的问题。首先,降低了书目数据的准确性。通过正题名或索书号检索时都可能检到一条以上的书目数据。给图书的采访、编目的查重工作和流通的借阅工作带来了不必要的麻烦。其次,同书异号使系统具有大量的数据冗余,降低了图书馆自动化系统的有效运行效率。书目数据合并中存在的问题是造成书目数据覆盖与丢失的重要原因。由于书目数据的准确性差和数据的大量冗余,致使系统在自动生成种次号时难以保证其唯一性和正确性,从而加重了同书异号和异书同号现象,使具有相同索书号的书目数据之间相互覆盖并导致部分书目数据丢失。

2.2 系统软件自身的不足。

系统软件自身的不足也同样是造成数据覆盖与丢失的重要原因。在PFT系统数据库中允许重复数据的存在,就是其系统软件的一个最大的弱点。一般的系统软件在图书编目时,录入ISBN或正题名后,会对中央数据库进行查重,如果遇有ISBN或正题名相同的数据,系统软件会给予提示,经编目人员确认、对登录号修改后存盘即完成数据的录入;如果没有查到相同的数据,系统也会给予提示,录入数据后存盘时,系统会对录入的索书号再次进行查重,如发现索书号重复系统会拒绝进行存盘操作,并要求修改索书号。这样就避免了数据库中同书异号和异书同号现象的存在和数据的冗余,也就避免了因索书号相同所带来的数据覆盖与丢失。而PFT系统缺少这样严格的查重和明确的提示功能,则难以避免数据的覆盖与丢失。

2.3 人为原因

除上述两种原因外,人为因素也可以造成数据的覆盖与丢失现象。当一种图书著录完成后,按"ctrl+end"键存盘时,不论其是二次进馆,还是索书号重复,PFT系统出现三种提示。这时如果编目人员错误地选择了一种处理方法,就会造成书目数据的覆盖与丢失。

3 对策建议

3.1 加强业务培训。通过加强对编目人员的业务培训,提高工作人员的计算机应用能力和对系统软件的熟悉程度,增强编目人员自身对系统软件问题的处理能力,从而避免因人为原因造成的数据的覆盖与丢失。

3.2 系统软件升级。对于由系统软件自身不足所产生的数据覆盖与丢失现象,可以通过对系统软件的升级来解决。或者利用软件开发商的售后服务,要求其提高软件的性能。从而减少由系统自身所产生的数据覆盖与丢失。

3.3 加强数据库的维护

(1)删除冗余数据。删除冗余数据能够有效地减少数据库中存在的同书异号现象,从而提高系统的有效运行效率。避免因数据冗余而造成的数据覆盖和丢失。对同书异号数据的删除,要取得流通、阅览等部门的配合,同时对书标的索书号进行修改,使同一种图书具有唯一的索书号。

(2)修改错误数据。在删除冗余数据的同时,对错误数据进行修改。尤其要重视对异书同号的数据的修改,使不同的图书具有各自不同的索书号,避免因异书同号所造成的数据覆盖与丢失。

(3)进行数据库索引。对数据库进行定期或不定期的索引,提高系统检索的准确性。避免因数据内部微小的误差引起的系统检索错误,从而减少数据的覆盖与丢失。

标签:;  ;  ;  ;  

书目合并后的数据覆盖与损失分析_大数据论文
下载Doc文档

猜你喜欢