中国国家标准在线检索系统的建立_数据检索论文

中国国家标准在线检索系统的建立_数据检索论文

中国国家标准网上检索系统的建立,本文主要内容关键词为:国家标准论文,中国论文,检索系统论文,网上论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

在产品极大丰富的今天,人们告别了过去单一化的生活,面对琳琅满目的产品有了更大的选择余地,对产品质量也有了更高的要求。对企业来说,质量成为其在市场竞争中立于不败之地的生命源泉。而标准又是质量的保障所在,因此各企业无不重视标准,科研机构无不研究标准。其中中国国家标准是国内标准的重要组成部分。但是,面对这样巨大的需要,国内目前的中国国家标准(以下简称国标)查询情况如何呢?

1 国标检索的现状

1.1 国标出版编排特点

目前提供国标全文的有汇编本和单行本两种形式。单行本顾名思义是一条标准的全文即形成一本书,而汇编本均按照发布时间先后(标准顺序号)分册出版,又分为两种:

(1)普通汇编本:它从1983年开始出版,收录我国自1963年以来发布的国标,并每卷标明了该卷收录国标的起止号。

(2)修订汇编本:它从1994年开始出版,将当年修订的国际分若干卷出版。

1.2 标准出版特点对图书馆收藏的影响

很明显,由于单行本在标准颁布后即可发行,其时效性明显高于汇编本。但是单行本量多质薄,容易损失,因此大多数图书馆都是以收藏精装的汇编本为主。但这有一个问题:标准是随时代和科技的发展而不断变化的,一条标准在颁布实施若干年后会被修改以适应新形势的需要。而如前所说,我国自1994年以后才开始出版修订标准的汇编本,1994年以前修订的标准则没有收藏于汇编本中,是以单行本存在的。因此对于只收藏汇编本的图书馆来说,就存在一个收藏真空:缺乏1994年以前修订的标准全文,而这些标准的大部分现在还没有被重新修订,在各行业仍作为现行标准使用,也仍应作为收藏的对象。因此一个图书馆除收藏汇编本后,还应收藏1993年以前修订标准的所有单行本才能收齐全部国家标准。

1.3 检索国家标准的方法及现状

——获得标准号

读者查询标准的主要方式是获得标准号。标准号由代号+序号+年份组成:代号采用GB(GB/T)表示,GB指强制标准,GB/T指推荐标准;年份则是指该标准制定或修改的年份。读者应了解,修订标准的标准号仍沿用原标准的标准序号,只是在年份处改为了该标准被修改的年份,并且该标准即被收录在该年份出版的修订汇编本中。因此在进行标准查询时会出现标准序号相同而年份不同的情况,这就说明该标准是被修订了的,且年份越靠后的那条标准才是最新的标准。比如GB/T 15514,标准名为中华人民共和国口岸及有关地点代码,到目前为止,先后有GB/T 15514-1995、GB/T 15514-1998两条标准,说明其最初制定于1995年,后在1998年被修订,现在执行的最新标准即为GB/T 15514-1998。

标准号的查询可以通过几种方式进行:一是手工检索方式:读者可利用《中华人民共和国国家标准目录》通过分类查询标准号;二是光盘检索:国内虽有标准的光盘数据库但购买价格昂贵;三是网络检索:目前国内有一些网站能进行标准检索,比如http://www.tbtinfo.com/,读者可通过关键词等途径获取标准号。

——获取原文

在获得标准号查找其原文时,由于普通汇编本每卷的书脊上都标明了该卷书所收录的标准起止号,因此对于新制定或已制定但还没有被修改的标准很容易查找到其所在卷期及全文;但是如果根据序号查找不到其所在卷期,则说明其是修订标准,这时候就需看该标准号的年份:如其年份<1994年则需查询该标准的单行本;如年份≥1994年则按照其具体年份到该年出版的修订标准汇编本中查找。

随着互联网的发展,网上检索已成为读者常用的方便的检索方式。但在各网站通过关键词等途径获得标准号后要查阅原文须支付较高的费用。这在用户无法确知查出标准是否与需要密切相关的情况下常常会让用户花费大量的财力和时间仍无功而返。鉴于目前这种查找1994年以前修订标准的困境,笔者拟建立一个标准网上检索系统,读者通过该系统,可查询及免费获得1994年以前修订标准全文,对于这部分标准之外的国际也可通过各种检索途径获得标准号等查找原文的线索,然后到我中心获取原文,从而使读者获得最大的方便和满意度,提高馆藏利用率。

2 国标网上检索系统的建立

2.1 利用馆藏,建立国标数据库

2.1.1 数据库管理软件的选择

目前常用的数据库管理软件有Access、SQL-Server、Oracle、Sybase等。等者认为应选择微软的SQL Server建立本标准数据库,因为:

(1)国标是连续发布、数量较大的动态信息,但又达不到Oracle、Sybase数百万条数据的规模,正好符合SQL Server对数据的要求。

(2)为避免误操作或其他原因造成的对系统的破坏,一个有效的措施就是建立浏览器/服务器(Browser/Server)结构模式。我们可将安装于Windows NT端的SQL Server作为服务器端建立标准数据库,并用ASP编写WWW检索程序,用户可通过浏览器在网上检索数据,而不能对数据作任何修改。这样整个系统的安全性与数据库完整性都由Server集中控制,稳定性强,数据准确率高。

2.1.2 数据库的构成

(1)收录的范围

本标准数据库包括国标数据库及相关的标准信息数据库2个子数据库。

相关标准信息库并不是某条标准的具体内容,而是用于解释标准和方便建库。因为为了节省数据库空间,提高查询速度,建库时常将固定的信息用简短的代码代替,而这些代码则在另一个数据库中进行说明,以待读者查询。以一条标准信息为例:

A14 GB13143-91情报与文献工作词汇、传统文献422 TJ B参照ISO5127/2-83……

相关标准信息数据库应包括专业分类号和类名数据库(列举所有根据《中国标准文献分类法》对专业的一级和二级分类详细内容,如A14代表综合类的图书馆、档案文献与情报工作一类)、国外常用标准代号数据库(ISO、IEEE等)、标准类别代号数据库(如TJ指通用基础)、采用其他国际标准程度代码数据库(指该标准等同、等效、非等效其他国际标准情况,如参照ISO 5127/2-83)等。

(2)字段设置

基于《国标》,本数据库的结构已初具雏形。字段方面应设置分类号、标准号、标准名称、标准水平代码、采用程度、修改日期、代替标准、原文提供、页数等字段。

需要说明的是:

一是由于标准总是处于变动之中,因此应设立“代替标准”字段,即对于某标准将过去某旧标准取而代之的情况,应在旧标准记录中的“代替标准”字段中注明被哪条新标准所代替,而相应地在新标准记录中的同样位置注明取代哪条旧标准以相互参照。这样更便于用户比较新旧标准的不同及其原因,从而更好地理解与应用该标准。

二是由于本系统制作的目的之一便是为了弥补其它检索网站无法免费或以较小的代价获取全文方面的缺陷,因此原文提供字段的设置极其重要,特别是对于修订标准。

2.1.3 数据库数据的来源

鉴于本中心收藏有全套《中国国家标准汇编》,笔者决定利用它建库。但由于图书出版的周期性影响,该书在内容上相对滞后,只能保证颁布已久的标准数据。而用户需要查找近期新制定的标准,数据又从何而来呢?

一是查找期刊,如《中国标准化》和《中国标准导报》。其中《中国标准化》设有“新国标、行标、地标与修改单”栏目,介绍新颁布标准的“标准号、标准名称”等信息。

二是与当地新闻出版署联系。该署提供最新发布标准的全文信息,但需支付一定的费用。但在实际建库时,要获得1994年以前修订标准的目录及相关信息,需要查阅最新的2001年度《中华人民共和国国家标准目录总汇》,从中找到现行的这部分标准。这是一件工作量巨大的工作,但却是建立本系统必不可少、并且是最重要的一部分。

2.2 网上标准检索的实现

为方便读者检索和系统管理人员分析系统使用情况,该标准检索可提供以下功能:

——系统管理功能:用于对用户权限、口令等的设置;

——信息查询功能:系统应提供分类号、标准号、标准名称关键字、采用其他国际标准程度代码(以便于用户查找与国际接轨的中国标准)等多途径检索;

——统计分析功能:能对历史查询情况进行统计分析,从而一方面了解用户的使用率,另一方面也便于设计者针对用户在使用中出现的问题对系统进行改进。

我中心已建立http://www.clas.ac.cn/standard/standard.htm网页供读者查询标准,但由于要提供1994年以前修订标准的全文,需对标准原文进行扫描,工作量较大,还有一定的设备要求,因此目前本网站还没有提供网上全文服务,有待进一步完善。该网站分简单检索和复杂检索,简单检索可对任一形式的检索词(包括标准号、标准名称、替代标准、等同标准等)进行检索,并支持右截断($);复杂检索则可支持与(*)、或(+)非(^)、相邻(G)、(F)等逻辑运算和位置运算,并支持右截断($),以提高检索的查准率。

3 标准检索系统的前景

随着国际经济逐渐一体化,国内企业面对来自国内外同行的激烈竞争,就必然在企业管理、产品质量等各方面向国际标准靠拢,因此应将其发展成为一个提供国内外标准信息的数据库。

收稿日期:2002-03-22。

标签:;  

中国国家标准在线检索系统的建立_数据检索论文
下载Doc文档

猜你喜欢