国内外主要期刊数据库系统之比较研究,本文主要内容关键词为:国内外论文,期刊论文,数据库系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
资料
[摘要] 分析了国际连续出版物数据系统(ISDS)、美国连续出版物联机合作计划(CONSER)、全国西文连续出版物联合目录数据系统、中国期刊大词典数据系统和中文现期报刊目录数据系统在收录范围、数据项目及格式等方面的异同, 对我国编制数据库存在的问题提出了8项对策。
[关键词]期刊 数据系统
建立完善的期刊数据系统是计算机管理期刊的重要环节。目前国外最著名的期刊数据系统当推国际连续出版物数据系统( InternationalSerials Data System,简称ISDS )和美国连续出版物联机合作计划(Cooperative Online Serials Program,简称CONSER)。国内则为全国西文连续出版物联合目录数据系统、中国期刊大词典数据系统和中文现期报刊目录数据系统。评述这些期刊数据系统的特点,比较其异同,分析其存在的问题,并提出对策,无疑对促进我国期刊管理自动化和书目数据的共建共享,具有重要意义。
1 几个期刊数据系统的概况
1.1 国际连续出版物数据系统(ISDS)
该系统由联合国教科文组织于1972年创建,是一个国际性系统。起初仅负责各国科技期刊的注册,以后扩大到各类期刊及其他连续出版物。总部设在法国巴黎。《国际连续出版物数据系统准则》(Guidelines for ISDS)一书对ISDS 的管理、政策和发展过程有专门介绍。该系统的一个主要任务是管理国际连续出版物标准编号(International Standard Serials Number, 简称ISSN),负责与各国和地区中心联网。各国国家中心负责管理本国国内出版的期刊书目信息,密切与出版者和用户的联系,它也是全国网络的中心。巴黎国际中心则协调国际数据库的建立,统一操作过程,不断维护ISDS的标准、规则和格式。
ISDS是一个双层结构系统,兼有集中与分散系统的优点。各国国家中心起着承上启下的关键作用,一方面与国内期刊出版者、管理者和利用者联系,一方面又是ISDS网状组织的一个焦点。目前几乎所有发达国家都加入了ISDS。我国于1985年11月正式成立了ISDS中国国家中心。
ISDS国际中心要求登录的数据主要有:(1 )建档日期(包括新记录及修正记录,次序为年/月/日);(2)出版现状(c代表现刊, d代表停刊.?代表现状不详);(3)创刊年;(4)停刊年;(5 )出版国家(采用ISO3166三个字母的标准代码):(6)出版周期;(7 )中心代码;(8)出版物类型,如p代表定期期刊,m代表专题集刊,n代表报纸;(9)题名文字;(10)出版物语种;(11)ISSN ; (12 )CODEN及其他代码;(13)分类号,采用国际十进分类法(UDC)或杜威十进分类法(DDC);(14)缩略识别题名,中文则不缩略, 西文根据国际题名词缩略表确定;(15)识别题名;(16)出版项;(17)本刊被哪些文摘、索引期刊所选用;(18)编辑机构名称;(19)依据国家编目规则确立的编辑机构或会议名称;(20)其他文种版本;(21)某刊的副丛刊;(22)副丛刊;(23)其他文种版本;(24)某刊的插件或增刊;(25)改名前的题名及ISSN;(26)后续题名及ISSN;(27)相关题名及ISSN;(28)插件或增刊,其题名及ISSN。在这些要求登录的项目中,第1、5、7、11、15项是短记录使用项,其余为记录使用项。第1、2、3、5、6、7、8、9、10、11、13、14、15、16项是必需项。
1.2 美国连续出版物联机合作计划(CONSER) CONSER 原系1973年在美国图书馆协会年度会议上提出的将连续出版物编目转换成机读目录的一项计划,后发展为连续出版物联机合作计划。其宗旨为:①提供一个可靠和权威性的连续出版物数据库,以满足图书馆各类型用户、其他信息用户和发展中国家、国际书目网络的需要;②帮助美、加两国国家图书馆建立和维护连续出版物机读数据库;③向ISDS提供有用的来源数据;④帮助各地进行联合目录的编制;⑤确保执行全国和国际有关连续出版物书目记录生成和维护的各种标准、规则和条例;⑥找出数据库在收录范围,如收录的主题类目、语种等方面的不足,以作适当修正。纽约州立大学、纽约州图书馆、加州大学、明尼苏达大学、耶鲁大学、康纳尔大学均为CONSER的发起馆。80年代以来,增加了很多成员馆。近年来,美国研究图书馆协会(CRL)、化学文摘社(CAS)和麻省理工学院等著名团体和院校也加入了CONSER,这将有助于建成一个包括所有语言、所有学科的连续出版物数据库。CONSER由美国OCLC 负责执行, 从OCLC或OCLC的任何一个成员网络中均可获取CONSER的数据。CONSER是连续出版物资源共享发展中最重要的一项计划,它与OCLC的合作也最具价值。CONSER数据可通过联机获得,对期刊及连续出版物的订购、馆际互借、联合目录、登到、馆藏发展决策均有重要作用。
CONSER的数据主要包括:题名/责任者、创刊年、出版地、出版者、出版年、载体形态、出版周期、价格、题名变化、关键题名、ISSN、主题词、OCLC号、杜威分类法分类号、国会图书馆分类法分类号(索取号)等,其格式与标记符号均根据《国际标准书目著录(连续出版物)》(ISBD(S))、《英美编目规则第2版》(AACR2)。 磁盘格式采用US—MARC格式。
1.3 全国西文连续出版物联合目录数据库
该数据库由北京图书馆联合目录编辑组编制。现可提供1984~1990年全国600 余家图书情报系统入藏的近2万种期刊、报纸、会议录的数据, 较完整地揭示了国内西文原版连续出版物的入藏情况。该数据库依据ISBD(S))、AACR2与国际《连续出版物著录规则》(GB3792.3—85),数据项目除包括一般的书目信息外,还有中国图书馆图书分类法分类号、中图公司刊号、题名关键词、缩略题名、北京图书馆索取号、中文国别代称、中译名、馆藏信息等。磁盘格式采用中国机读目录通讯格式。
该数据库是我国第一个采用国际标准目录格式编制的大型西文连续出版物联合目录数据库。收录范围较广,排检项目统一、规范,可提供数据软盘、目录卡片、书本目录(1989年版)、人员培训、建库辅导等多种形式的服务。目前,正对该数据库1990~1994年的数据进行更新和扩充。该数据库的建立对于促进国内各单位的标准化与规范化著录、编目成果共享、国际书目交流和计算机应用均有积极意义。
1.4 中国期刊大辞典数据库 该数据库是于1993 年由中宣部出版局和文化部图书馆司联合编制的。收录范围为1815年至1991年国内外所有的中文期刊,1949年后的期刊只收正式出版的,台湾省出版的期刊列为附录,共计4万余条。该数据库为回溯转换型,类似于CONSER。 数据包括国际《连续出版物著录规则》的八大项目及中国图书馆图书分类法分类号、杜威分类法分类号、订购号、统一刊号、主题、主要栏目、内容特征(包括著名篇名)等。
1.5 中文现期报刊目录数据库 该数据库由北京图书馆编制。 它以5寸磁盘载体形式出版全国的现期报刊目录,共收录了1988~1991 年出版的9 000余种中文报纸和期刊,包括台湾、香港、 澳门的主要报刊,并根据“领土——语言”原则收录了少量海外出版的中文报刊。该数据库根据ISBD(S )(国际标准书目著录[连续出版物]和国际《连续出版物著录规则》的详细级次做了充分著录,除八大项目外,还有中国图书馆图书分类法分类号、杜威十进分类法分类号、统一刊号、订购号、版权号、主要栏目、内容简介等。磁盘格式采用《中国机读目录通讯格式》。
2 国内外期刊数据系统之比较
ISDS与CONSER均为国际性的数据系统,不仅收录期刊、报纸,还包括年度出版物、不定期连续出版物等。两者都非常重视ISSN和CODEN。ISSN和CODEN 是目前全世界两种庞大而简明的期刊(连续出版物)鉴定系统,它们已成为很多数据库的重要部分。ISSN在我国已被较普遍地使用,介绍也颇多,而CODEN则评述不够。 ISSN 由8 位数码组成, 如《Special Libraries》,其ISSN为0038—6723。1974年开始设计, 后被广泛使用。在ISSN正式颁布之前,美国鲍克公司受命对其数据库中的连续出版物和1950~1970年《新连续出版物题名》(New Serials Title)中的连续出版物配上ISSN数码。由于配号是按题名字顺的先后配的,因此,首批ISSN的数码大小反映了字母的顺序。但后来按国家分配了一批ISSN数码, 这种一定的对应关系便不复存在。 国内一些论著上关于ISSN的数码大小反映字母顺序的说法是不全面的。给各国分配的号码数量与各国新刊的增加量是成正比的。如日本每年有2 000种新刊出现,故一次先配发5 000个ISSN号给日本的ISDS国家中心。 而印尼新刊增加量极微,所以第一次只配给600个号。一组号码配派完之后, 再向巴黎中心申请第二组号码,因此一个国家中心所配派的号码无法始终连贯,而只能是一组一组的号码相对集中。
CODEN作为题名缩称代码,是于1953年由比绍博士(Dr.Bishop)发明的,当时他用简单的、易于记忆的4个代码代替期刊刊名, 这对期刊的管理非常有用。60年代又将其推广至参考书、专利等方面,数码增至5位。当将其应用于电脑时,又增加了第6位校验号码。目前CODEN由6位字符组成,前4位字母根据一定规则取自题名,第5个字母是区别符,第6位为校检号,或字母或数字。期刊的CODEN 前5 位永远是字母, 如《American Journal of Comparative Law》的CODEN就是AJCLBT。
ISSN与CODEN都以一种号码代表一种期刊,具有唯一性, 将它们应用于期刊的订购、登到、检索上十分便捷,也非常适用于计算机处理。两者包容的数量都很大,足够分配给现刊和过刊;除都设有国际中心负责配号外,还都出版配号指南——《ISSN与识别题名对照手册》和《国际CODEN指南》;都印在期刊封面右上角的明显处。
两者的不同点在于,ISSN不可以自定号码,分配之后,永不再改,而CODEN在未获得之前,可自定“准CODEN”,然后再予修订;ISSN 为7位阿拉伯数字与1位校检号(或数字或字母),数码别无其他意义, 不具有分类、分地区或助记的作用,而CODEN则有助于刊名的记忆, 尤有助于记忆拉丁字母的刊名, 但对记忆非拉丁字母的刊名则较为困难;ISSN专用于期刊,而CODEN主要用于科技期刊,也用于参考工具书、专利等;ISSN 的分配是一个双层系统, 因此取得ISSN 较方便快捷, 而CODEN只有一个设于美国的俄亥俄州的配发中心;ISSN 与识别题名已成为任何编目款目中的一个项目,直接影响AACR的修订,而CODEN 的影响则要小一些;由于ISSN比CODEN用得多,从长远看,ISSN比CODEN更占优势。但是总体说来,ISSN与CODEN各有作用,彼此并不排斥。
从数据项目看,ISDS偏重于连续出版物的登到情况,而CONSER有较完整的书目信息,其数据项目、格式、标记符号均遵循ISBD (S )。ISBD(S )的主要目的是在国家书目内创立一个一致性的期刊鉴别记录,它包含所有对揭示期刊目录有益的资料;还对记录和识别期刊所需的各著录单元给予界定,并规定一定的顺序,以清晰可辨的标点符号作间隔,采用区别性题名(distinctive title)作为最主要的款目。 ISBD(S)中的印刷地、印刷者、载体形态项、丛刊项和附注项是ISDS 数据项目中所没有的,可见ISBD (S )更接近图书馆的期刊管理内容, 而ISDS的项目则主要为登记之用,是为期刊控制的目的而设计的,比较实用,不大注意编目规则中的项目。
但是ISDS与ISBD(S)也在相互协调和补充。首先, 各方召开的主要工作会议均邀请对方的代表参加,充分听取各自的建议和意见,尽可能协调一致。其次,ISDS的关键题名与ISBD(S)的区别性题名, 在很多情况下是一致的,约5%的不致者,可以通过ISBD(S)中的附注项给予解决。再次,ISDS正试图吸取ISBD(S)的部分成果。比如,ISBD(S)的标记符号的使用, 消除了语言障碍, 利于电脑鉴别, 在 ISDSBulletin里,保留了ISDS的数据项目,但是却采用ISBD(S) 的标记符号, 将两者揉合在一起。
总之,ISDS是比CONSER更大的期刊系统,各自有自己的目的和侧重面,彼此相互协调,并不排斥。
我国的全国西文连续出版物联合目录数据库,在收录范围上与ISDS和CONSER相同,均为“连续出版物”。在数据项目、格式、标记符号上,则与CONSER较为一致,只是数据还不如CONSER详细,尤其在排检项上,如无主题标引、分类以中图法或中图公司分类号为主等。磁盘格式采用的是中国机读目录通讯格式。
我国的两种中文报刊数据库除收录范围仅为连续出版物的一部分报刊外, 其余方面与全国西文连续出版物联合目录数据系统相同, 即与CONSER较为接近。
3 我国期刊数据系统存在的问题及对策
从以上比较可知,我国期刊数据库的建立虽晚于国外,但从数据项目到磁盘格式很快就跟上了有关国际标准,这是值得肯定的。但是,为了完善标准化建设,为国内各馆编制自己的期刊数据库创造有利条件,有几个问题值得注意。
3.1 收录范围 国外数据库收录的是整个连续出版物, 而我国中文数据库仅收录报刊,其余非报刊的连续出版物要不要建库?是否单独建库?单独建库又如何与国外连续出版物数据库统一、接轨和共享?这都是值得研究的问题。至于西文非报刊连续出版物,也还存在名义统一而实际不统一的问题,因为相当数量的西文非报刊连续出版物,如年度出版物、会议录、丛刊等,在我国西文连续出版物数据库中没有得到反映,而被收录在图书里。
3.2 分类标准 国外数据库推荐的标准是杜威十进制分类法、 国际图书十进制分类法和美国国会图书分类法。目前我国期刊分类使用较多的是中国图书馆图书分类法、中国图书馆图书分类法期刊分类表、中图公司分类表(主要类分外文期刊)。一些社会科学期刊还用过中国人民大学图书馆分类法。我国对中外文期刊是否要使用统一的分类表?如使用,选哪一种为好?
3.3 主题标引标准
国外使用较多的是美国国会图书馆主题标目表。国内中文期刊标引是否采用汉语主题词表?外文期刊是采用国会图书馆主题标目表?还是抛开固定词表,采用关键词标引?
3.4 磁盘格式标准 我国大多采用中国机读目录通讯格式。 但一些正在建立的数据库则采用美国书目数据机读目录格式(US—MARC),如国家教委文科文献信息中心西文期刊联合目录数据库即是。尽管这些格式是根据国际机读目录手册制定的,但毕竟有不同之处。
为了解决以上问题,笔者认为应采取以下对策。
·组织专家对这些问题进行专题研讨,在充分论证的基础上,由有关方面尽快作出决策。中国图书馆学会、北京图书馆、全国高校图书馆期刊工作研究会可以发挥必要的作用。
·中文报刊数据库应扩展至连续出版物数据库,外文连续出版物数据库也要解决名实一致的问题。既然我国已接受了国际标准中有关连续出版物(serials)的概念,那么就应在实际工作中加以执行。 由于改变传统的方法工作量大,所以目前可采取一些变通的办法,如老问题以后解决,而先解决新问题,即可以规定从何时起集中处理所有连续出版物。总之,或早或迟这一问题总得解决。
·中文报刊及连续出版物数据库就以我国一种分类表为标准,即中国图书馆图书分类法期刊分类表。因为该表是在中图法的基础上结合期刊出版的特点制定的,使用了8年,现已出了第2版,已有很好的基础。有些人认为该表不够专深,不能作为标准。实际上,期刊与图书在分类上各有其特点。总体而言,期刊内容广泛,入类宜粗些,但是在《中国图书馆图书分类法期刊分类表》第二版中有的类目已分到了四级类,也较深了。至于有的类不够深,可以根据期刊实际情况加以修改。从长远看,我国收藏的外刊也应与中文期刊一样配有《中国图书馆图书分类法期刊分类表》分类号。鉴于中图公司分类表使用多年影响较大,可与《中国图书馆图书分类法期刊分类表》并存一段时间后并轨。
·中文报刊的主题标引用《汉语主题词表》,外刊可暂用美国国会图书馆主题词表,以后在条件成熟时,我国收藏的中外文刊也可统一使用一个主题词表。关键词标引简便易行,可先试行。以后即使有主题词标引,关键词仍保留。
·中外文期刊数据库的磁盘格式一律采用中国机读目录通讯格式。
·抓紧培训数据编制人员,普及有关知识,定期研讨其中的疑难问题,并做出统一处理规定。
·将中国期刊数据库与中国期刊论文数据库结合起来考虑,尽量使两者兼容、通用,如分类表、主题表等,同时也应考虑主机机型、软件的通用。
·将我国高等教育系统的“211工程”图书馆信息网、 科委和公共馆系统的信息网结合起来考虑,并为今后可能出现的中国信息高速公路创造必要的条件。
收稿日期:1995—03—13
A Comparative Study of the Main Data Systems of Serialsat Home and Abroad
Ye Jiyuan
(Nanjing University Library)
[Abstract]Analyses the similarities and differences incoverage,data items and data forms,etc.of ISDS,CONSER,anddata systems of Union Catalogue of Western Serials in China,AGrand Dictionary of Chinese Periodicals,A Catalogue
ofCurrent Periodicals and Newspapers in Chinese,and
putsforward eight proposals to solve the problems existing in theproduction of data bases in China.