我国数字图书馆信息组织领域标准规范现状与分析,本文主要内容关键词为:标准规范论文,数字图书馆论文,现状论文,领域论文,组织论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2012-08-24
0 引言
数字图书馆是网络技术和计算机技术在图书馆应用的产物,而数字化信息组织是数字图书馆信息资源组织的基础结构,数字图书馆信息组织的标准化更是数字图书馆进行资源组织、资源共享和为用户服务的基础,是数字图书馆实现互操作和可持续发展的必要条件。本文就我国数字图书馆信息组织领域的标准规范现状进行分析,旨在从标准规范的数量、种类、标龄、现行状态等方面了解和掌握我国该领域的研究状况,从而找出数字图书馆信息组织标准规范领域中存在的问题,并为我国数字图书馆信息组织领域标准规范建设提供具有使用价值的数据和建议,以求更好地推动我国数字图书馆信息组织标准化建设,完善我国数字图书馆信息组织领域标准规范体系。
1 国内外数字图书馆信息组织标准规范研究现状
1.1 数字图书馆概念及数字图书馆的信息组织的标准化 数字图书馆(Digital Library),也称电子图书馆或虚拟图书馆,是一个内涵很丰富的概念,其“解”并不唯一,数字资料馆、数字资料库和数字图书馆等都是Digital Library的可能解释[1]。即数字图书馆有广义和狭义之分,广义的图书馆是指数字信息的资料库,这种概念多半为计算机界人士所接受,而狭义的数字图书馆则是指数字化的图书馆,多被图书馆界人士所接受。笔者在本文中所提到的数字图书馆,则是采纳其狭义的解释,数字化图书馆。
随着数字图书馆的发展,数字图书馆的资源主要分为3种:一是自建的馆藏数字化资源;二是本馆根据需要自建或合建的专题资源;三是网上信息资源的整合[2]。数字图书馆资源的变化,从而使数字图书馆信息组织的方式和方法产生了许多变化:信息组织的对象从各种类型的数据发展到具有丰富内容的知识,组织形式从数据结构发展到知识表示,组织方式从单一发展到动态的多模式链接[3]。能够多维度揭示信息资源。具有大众性标签语言的出现,元数据的发展,大众分类法Folksonomy的崛起,以用户为中心信息组织理念的转变[4],使得数字图书馆的信息组织已经不单单是对于信息资源的描述、标引和排序,而变成了获取、收集、分析和组织关于数字图书馆馆藏的标识、管理、定位和解释的任何信息的过程。
而标准化则是数字图书馆信息组织的生命,也是目前数字图书馆信息组织面临的头号难题。没有标准化就不能形成数字化信息组织的方法体系。数字化信息组织的标准化趋势是指通过权威机构组织相关专家学者研究制定并颁布执行各种相关标准,即数字化信息组织的每一种方法及操作,数字化信息组织的规则等都要按一定的标准执行。表现为信息描述和标引的标准化、机读目录格式的标准化和数字化信息组织方式的标准化等[5。
1.2 国内外数字图书馆标准规范的研究项目及现状 国外数字图书馆标准规范的研究和建设始于20世纪80年代末和90年代初。美国的数字图书馆先导计划(DLI)一期和二期[6]、加州数字图书馆(CDL)、英国国家数字图书馆(DLS)、英国国家分布式电子资源(NDER)[7]以及联合信息系统委员会数字图书馆(eLib)[8],德法日俄韩等国家的数字图书馆建设项目中,标准规范都是一项非常重要的建设内容,而且总是在继承的基础上不断完善和扩充。
而我国的数字图书馆标准规范研究和建设则主要是集中在2002年10月科技部启动的《我国数字图书馆标准规范建设》、CALIS数字图书馆建设标准和规范、中国数字图书馆工程、中国科学院国家数字图书馆项目、上海数字图书馆的元数据标准和清华大学的EMANI等项目中。随着项目研究的进展,数字图书馆的相关标准作为项目的成果也随之产生[9]。同时,我国政府在此期间也高度重视信息资源开发利用及相关的标准化工作,与数字图书馆相关的标准化技术委员会也制定了一定数量的标准规范。
但由于目前我国尚未形成数字图书馆信息组织标准规范管理机构,从而造成了数字图书馆信息组织领域内标准规范种类名目繁多,范围互相重叠,质量参差不齐等问题。
1.3 数字图书馆信息组织标准规范范围的界定 笔者对我国数字图书馆信息资源描述与组织的标准规范进行研究,主要包括数字图书馆信息组织过程中所涉及的关于信息系统、数据结构、数据内容、检索工具、内容标识、规范控制等方面的标准规范,旨在从标准规范的数量、种类、标龄、现存状态、内容等研究我国数字图书馆信息组织领域标准规范存在的问题以及建议性的解决方案,争取为我国数字图书馆信息组织领域标准规范建设提供实用价值的数据和建议,促进我国数字图书馆信息组织领域标准规范体系的建设和完善。
2 数字图书馆信息组织领域标准规范数据收集
根据《中华人民共和国标准化法实施条例》[10]规定,我国标准分为四级:国家标准、行业标准、地方标准和企业标准。
笔者以“国家标准文献共享服务平台”(http://www.cssn.net.cn/)[11]为数据来源,根据国家标准、行业标准、地方标准和企业标准的属性特征,人工筛选和分别收集与数字图书馆信息组织相关标准,并以商业性网站“工标网”[12]进行补充和完善。选取标准的范围主要有信息描述、信息著录、信息分类、编目、信息组织相关标准,以及国家、机构、人员、语言和日期代码、元数据标准(元数据格式和图书情报领域的元数据应用),不包括出版行业、图书期刊的编排和印刷标准,不包括标准化总则以及其他行业内部的元数据标准等,最终得到253条数字图书馆信息组织领域标准规范数据。
3 数字图书馆信息组织领域标准规范数据分析
在以上收集的数字图书馆信息组织领域标准规范数据的基础上,笔者从标准规范的层级状态分布、生命周期、采标程度、约束力和内容等几个方面对数据进行分析和研究,以期发现其中存在的问题。
3.1 标准的层级状态分布 综上所述,我国的标准分为国家标准、行业标准、地方标准和企业标准。而对于数字图书馆信息组织领域的标准规范来说,尚未存在企业标准。
在我国数字图书馆信息组织领域中,国家标准的数量最高,为206条,而行业标准和地方标准分别为41条和6条。这一方面是因为我国的国家标准是由中华人民共和国标准化管理委员会的下属委员会全国专业标准化技术委员会制定的,而其分委会TC4全国信息和文献标准化技术委员会则是主要针对于图书馆领域;另一方面是由我国的标准体系所决定的,我国的标准主要是以国家标准为主,行业标准、地方标准为补充的体制所决定的,从而造成了国家标准的数量远远高于行业标准和地方标准。
而对于行业标准进行进一步的分析,我们发现,档案行业标准所占份额最大,为56%。新闻出版行业和广播电影电视行业标准所占份额相等,均为17%,文化行业标准的份额最小,为10%。这种比例分布主要是由图书馆馆藏所决定的,因为档案资料是图书馆馆藏的一个重要部分,在国家标准中,对于档案的著录、分类标引和机读目录格式等做了规定,而对于一些特殊档案形式,如明清档案、革命历史档案、民国档案等均是以行业标准出现。而新闻出版、广播电影电视和文化行业则和图书馆领域存在一定的交叉融合。
3.2 标准的发布时间分析 标准的发布时间是指标准经过一系列的立项、起草、征求意见、审查等过程,正式出版发布的时间。图1为我国数字图书馆信息组织领域标准规范的年发布量。我们可以看出,从标准总量来看,我国数字图书馆信息组织领域最早的标准发布开始于1980年,随着时间的推移,经历了三个高峰期,即1994-1996年,2005-2006年,2008-2009年。这三个高峰期形成的原因也各有不同:1994-1996年期间,我们可以看到,标准的年发布量增加的原因是由于行业标准在此期间也达到了高峰;而2005-2006年的年发布量上涨是因为国家标准的年发布量的增加,而2008-2009年的激增则是由于国家标准、地方标准和行业标准的年发布量同时上涨所形成的。
图1所示我国数字图书馆信息组织领域标准规范年发布量的起伏趋势和我国的标准化过程、标准的标龄以及我国图书馆的发展是密不可分的。自从国务院于1979年7月31日发布《中华人民共和国标准化管理条例》[10]以来,我国的标准化工作正式进入规范化阶段。因此从1980年开始,各行业领域纷纷制定相关标准,图书馆信息组织领域也不例外,但当时标准的等级为国家标准、部标准(专业标准)和企业标准三级,并未出现行业标准和地方标准的表述。而随着1988年《中国标准化法》[13]的公布,正式将标准分为国家标准、行业标准、地方标准和企业标准四级,所以图书馆信息组织领域最早的行业标准开始于1987年(当时为部标准)。而自从2002年开始,我国的数字图书馆标准规范建设项目开始兴起,在这些项目中,开始建立一些新的相关标准,而随着80年代一些标准的废止和失效,对这些标准的重新修订和发布也在一定程度使标准规范的年发布量有所增加。
图1 我国数字图书馆信息组织领域标准规范年发布量
3.3 标准的标龄分析 标准是适应科学发展的结果,但是随着标准采用的科技成果逐渐被新的科技成果取代时,标准的先进性消失[14],其有效性也随之消失,因此需要对标准进行重新确认、审批和修改,并由此衍生了“标龄”的概念。标准的标龄是指自标准实施之日起,至标准复审重新确认、修订或废止的时间。由于各国情况不同,标准的有效期也不同。以ISO为例,ISO标准每5年复审一次,平均标龄为4.92年。我国在《国家标准管理办法》[15]中规定国家标准实施5年,要进行复审,即国家标准有效期一般为5年。但是对数字图书馆信息组织领域的标准规范的标龄进行分析,情况却不容乐观。
我国标准当前的三种状态,即被代替、废除和现行。被代替是原有的标准已失效,对该标准进行了重新确认、审批和修改,产生了新的标准;废除是指标准已彻底废止;现行是指当前正在实施阶段的标准。我国国家标准被代替77项、废除9项、当前现行120项;行业标准和地方标准均处于现行状态。
为了分析标准的标龄,对国家标准中77项被代替标准和9项废除标准进一步分析得到图2的结果。
从图2中可以发现,我国数字图书馆信息组织领域内的标准规范标龄严重失衡,标龄最小的为1年,最大的竟然高达26年。以5年为一个基点,对86项标准规范做进一步的分析,可以看到,标龄为0-5年的标准有9个,6-10年的标准有29个,11-15年的标准有16个,16-20年的标准为20个,21年以上的标准有12个,平均标龄竟然高达12.84年,为ISO平均标龄的近3倍,而且也远远超过了《国家标准管理办法》中规定的5年。
对现行的国家标准的发布年代进行统计,得图3。由图3可知,我国数字图书馆信息组织领域中仍在使用的国家标准最早的可以追溯到1983年,在2004-2006年和2008-2009年期间发布的标准最多,但是根据我国关于标龄的规定,2006年以前的标准均需要重新审批、确认和修订。
图2 我国数字图书馆信息组织领域标准规范标龄图
图3 我国数字图书馆信息组织领域现行国家标准发布年代图
而对于行业标准和地方标准的标龄,并没有相关规定。由此可以反映出,我国标准管理机构对于标准的维护方面存在很大的漏洞。虽然有相关法律条文明确规定了标准的标龄,但是对于已经发布的标准,并没有按照相关的规定进行重新审批、修改和确认,从而导致一些标准的标龄严重超标,以及一些20世纪80年代发布的标准仍在使用的情况。这同时也在一定程度上阻碍了我国数字图书馆信息组织领域的发展。
3.4 标准的采标程度分析 标准的采标,是标准采用国际标准和国外先进标准的简称,是指将国际标准或国外先进标准的内容,经过分析研究,不同程度的转化为我国标准。采用国际标准和国外先进标准,是我国一项重要的技术经济政策,对提升我国标准水平、促进技术进步、提高产品质量、扩大对外开放等有着重要作用,是反映我国采标工作情况和衡量我国国家标准总体水平的一项重要指标。根据现行《采用国际标准管理办法》(2001年)[16],我国国家标准与相应国际标准的一致性程度为等同、修改和非等效。等同、修改属于采标,非等效不属于采标。
对于2001年前指定的标准,根据《采用国际标准和国外先进标准管理办法》(1993年)[17],国家标准与相应国际标准的一致性程度分为:等同、等效和非等效。等同、等效和非等效均属于采标。
对收集的标准进行分析,我国标准的采标情况分为五种,即:等同采用(IDT)、等效采用(EQV)、修改采用(MOD)、非等效采用(NEQ)以及未说明采用情况。
对五种采标情况进一步分析,等同采用属于采标。2001年之前的等效采用以及2001年之后的修改采用,均是对国际标准进行了较小的修改,为采标。而对于非等效采用的情况来说,2001年前后的定义有所不同,2001年前的非等效采用为采标,2001年之后的非等效采用不属于采标。而对于未说明采标情况的标准来说,情况则较为复杂,主要有以下几种:a、由于《采用国际标准和国外先进标准管理办法》为1993年颁布,故1993年之前的标准,并未要求写明采标情况,所以其采标情况无从可知;b、我国标准的审批程序不严格,1993年之后虽然有明文规定,标准审批必须写明采标情况,但是也有部分标准并未遵守,造成采标情况不明确;c、某些标准属于我国自建标准,故无采标之说。对于a、b情况的标准来说,若其以前版本、替代版本对于采标情况有所写明,则按写明的采标情况处理,如标准GB 3792.1-1983无采标情况,但其2009版则明确写明采标情况为NEQ,则认为GB 3792.1-1983的采标情况为NEQ;对于c情况标准的处理,则认为该标准为我国自建,不采标。
根据以上所述处理方式,对我国的国家标准进行分析可以得出,我国采标标准数为90个,达到了标准总数的43.7%,其中IDT为43个,EQV为17个,MOD为20个,2001年之前的NEQ为10个。
3.5 标准内容分析 对我国数字图书馆信息组织领域标准规范进行分析,根据信息系统、数据结构、数据内容、内容标识、规范控制方面对该领域的标准进行分类,结果如表1所示。
信息系统是数字图书馆的底层架构,笔者所说的信息系统标准主要是指描述数字图书馆系统中各个组件的作用以及关系的一系列标准规范。其主要作用是使具有类似功能的分布式系统在实施路径方面更加连贯一致[18],并且更容易进行数据的交流和交换,这方面的标准主要包括信息交换用的编码字符集、置标语言等。
数据结构标准规范则是定义了数字图书馆系统中所包含的信息元素,如输入输出格式和记录类型等,这方面的标准以中国机读目录格式、规范格式,以及元数据的注册等系列标准规范为代表。
笔者所说的数据内容标准则是规定了数据结构标准规范中定义的每个元素输入信息的规则,主要包括各种文献的著录规则、时间日期刊名的表示方法等。
检索工具系列标准规范则是指对于可以辅助检索的索引、目录、检索期刊等编写的规定。
规范控制是数字图书馆信息组织的重要内容,主要包括描述控制、词汇控制、句法控制和其他相关因素的控制等方面,即包括叙词表的编制、文献标引等方面的标准规范。
代码类标准规范则主要是指用来标识实体的标准规范,类似URI的功能,如标准书刊号、标准文本/音乐作品编码、国家民族代码、地名机构代码等。
从表1可以看到,我国数字图书馆信息组织领域的标准规范中代码类标准规范居首,数据内容类标准规范次之,规范控制类和数据结构类标准规范不相上下。但是可以看到国家标准主要是在代码和数据内容方面居多,这主要是因为国家标准中关于国家、民族、语种、地名以及组织机构的代码标准较多,而关于图书、期刊、地图、档案等的文献资料的著录也均为国家标准,集中在数据内容部分。而对于行业标准来说,则主要是集中在规范控制和数据内容方面,而地方标准则均是关于地名、机构代码类标准。
4 数字图书馆信息组织领域标准规范存在问题及建议
从以上对数字图书馆信息组织领域标准规范概况的研究发现,该领域的标准规范存在严重的问题,主要表现在以下几个方面。
4.1 标准格式混乱,缺少必要的要素成分 我国《标准化工作导则第1部分:标准的结构和编写》[19]中,明确规定,我国标准应包括资料性要素(封面、目次、前沿和引言等)、规范性一般要素(标准名称、范围、规范性引用文件等)、规范性技术要素(术语和定义、符号代号和缩略语、要求、规范性附录等)、资料性补充要素、规范性技术要素和资料性补充要素几部分。而分析我国数字图书馆信息组织领域的标准,缺乏必要的要素的现象并不少见,如对于标准采标情况的缺失、标准替代版本表述不清、缺少引言等等。
4.2 标准层级混乱,标龄长 首先,是对于标准层级混乱。我国标准法明确规定,一旦有国家标准出现,则相应的行业标准、地方标准即行废止。而对于数字图书馆信息组织领域来说,国家标准和行业标准存在一定程度的交叉重复。其次,对于标准层级的整体状况来看,我国数字图书馆信息组织领域的标准规范主要集中在国家标准层次,而相应的行业标准和地方标准则较少,而随着数字图书馆研究的进展,我国现在已存在很多数字图书馆行业的公司,如书生之家、方正等,对于这些企业自身所制定规范的管理,仍是一个亟须解决的问题。最后,对于标准的及时更新和维护没有有效的管理机制,对于明确规定五年修订一次的国家标准,并未进行合理的修订和维护,从而造成了标准标龄长,20世纪80年代左右发布的标准仍在使用等现象。
4.3 标准的采标程度混乱 我国1993年出台的《采用国际标准和国外先进标准管理办法》和2001年的《采用国际标准管理办法》等对于标准的采标程度都有相应的规定。但是从我国数字图书馆信息组织领域的标准来看,其采标程度存在一定的混乱。主要包括以下几种:a.未写明采标情况;b.采标标识混乱,未使用法律明确规定的IDT、EQV、MOD、NEQ等标识,而是使用“编辑性修改”、“REF”、“参考”等字眼;c.某些标准采用的国际标准或国外先进标准已经更新版本,但是这些标准并未进行相应的更新和维护。
4.4 标准的内容陈旧,亟须更新 从上述标准内容的分析可以看到,我国数字图书馆信息组织领域的标准规范主要集中在传统的数据结构、数据内容、信息系统和规范控制以及代码等方面。而对于数字图书馆信息组织的新热点,如社会标签、搜索引擎、数据挖掘以及关联数据等方面,并没有相应的标准规范,这在一定程度上影响到了我国数字图书馆信息组织领域的发展。
综上所述,笔者认为应当为我国数字图书馆信息组织领域标准规范建立一种有效的管理机制。首先,应当借鉴ISO、NISO的标准先进管理经验,建立相应的管理机构,在掌握该领域全部标准的基础上,加大对标准的审批、发布和维护的流程控制,严格按照我国相关的标准法律的规定进行监督和管理;其次,应当对于一些标龄长、发布年代久远的标准进行整体更新和维护,充分借鉴和采用国际先进标准,防止发生闭门造车现象的产生;最后,需要及时掌握该领域国外发展动向,从而制定相应的标准,获得标准制定的主导权,成为该行业的佼佼者。