1991~1995年中国数据库研究综述_数据库系统论文

我国1991~1995年数据库研究综述,本文主要内容关键词为:我国论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[摘要] 统计分析了1991~1995年我国10种图书馆学情报学核心期刊上发表的有关数据库的论文313篇,研究数据库文献在各个主题的分布情况、文献发展的变化和被忽略的领域。

[关键词] 数据库文献 中国

本文采用调查法与文献计量法,统计分析了1991~1995年我国10种图书馆学情报学核心期刊(各5种)上发表的数据库文献313篇。由于《情报学刊》1994年停刊,共收集到10种期刊中的48卷。通过研究数据库文献在各个主题的分布状况,揭示我国数据库研究的重点、变化趋势和被忽略的领域。

1 我国数据库研究概述

我国数据库的研究和应用虽然起步较晚,但进展很快,大致分为三个时期:

1.1 介绍学习时期(70~80年代) 70年代中后期,我国学习国外数据库,在理论上进行探讨和研究,在技术上进行试验,特别是对汉字处理技术作了较为深入的研究和试验。因此,这个时期数据库研究文献的主要特点是:数据库研究文献开始出现,但数量不多,内容主要是围绕介绍学习国外已有数据库理论和成果。据统计[(1)],1978~1987年我国9种图书馆学情报学主要期刊的4791篇论文中仅有35篇是关于数据库主题的。

1.2 蓬勃发展时期(80~90年代) 80年代开始,我国紧跟国际上数据库的发展步伐,广泛研究并采用数据库新技术,一方面积极地开发和利用国外的数据库资源,例如引进国外的数据库设置国际联机检索终端;另一方面着手规划研建国内的信息资源数据库和管理系统。特别是1986年召开的全国计算机应用工作会议确定了“七五”期间重点建设国家经济信息系统、国家科技情报系统等12个国家级信息系统。这次会议为我国数据库建设创造了大发展的气候和环境。随着我国数据库研究的蓬勃发展,记载和反映数据库发展的文献数量迅速增长。根据以1981~1990年《全国报刊索引》为主要情报源的统计[(2)],我国数据库研究文献已达1477篇,从1981年的9篇到1990年的291篇,10年间增长了32倍。在这期间,数据库研究文献不但数量增长迅速,主题内容也呈现出多样化,涉及国外数据库引进问题研究、联机数据库检索系统研究、自建数据库技术研究等多方面。

1.3 稳定发展时期(90年代至今) 90年代以来数据库的发展进入了一个相对稳定的发展阶段。虽然现阶段数据库的数量增长呈下降趋势,但却更注重其自身的质量控制,我国的数据库建设正向更深层次、更高水平发展。与之相应的数据库文献数量也逐渐下降。据笔者统计,数据库文献数量最多的是1991年(81篇),之后逐年减少;论文最多的主题是数据库技术问题(占30.0%)、文献型与事实型数据库(占15.7%),可见现阶段我国的数据库研究更注重实际问题的研究。

本文的内容分析限定于我国数据库研究中最具有代表性的稳定发展时期内的1991~1995年,因为这一时期代表了我国数据库研究的较高水平。

表1 1991~1995年数据库论文在10种期刊的分布情况

为了研究和理解的方便,同时也考虑到人们的习惯,本文根据论文的研究内容与数据库载体形式,把论文划分成9个主题类目进行数据库论文的主题分布情况分析。

表2 1991~1995年数据库论文的主题分布情况 单位:篇

说明:①AR=平均排名;R=排名;N=数量;%=百分比;②9个主题类目按其平均排名顺序排列。

2 数据库论文主题分布情况分析

由表2可见:在9个主题类目中,1991~1995年论文最多的类目是数据库技术(占30.0%);其次是文献型与事实型数据库(占15.7%)。论文总数逐渐减少,其中数据库技术与书目数据库两类的论文数量相对稳定,表明这两个主题一直是研究的热点。

数据库其它问题与多媒体数据库两类的排名逐渐升高。尤其是数据库其它问题从原来的第6、第7位一跃成为1995年的第3位,表明随着数据库研究的不断深入,研究者开始注意到数据库的一些其它问题,如数据库版权保护、数据安全性等。而多媒体数据库研究的增多则反映了日新月异的信息技术对我国数据库研究的巨大影响。

关于数据库理论与我国数据库建设理论的论文分布却呈现出开口向下的抛物线,从1991年的9.9%攀到1993年的27.6%的颠峰之后,又下落至1995年的3.8%。表明研究者对数据库基础理论与我国数据库建设的研究在1993年达到高潮之后,开始从纯理论研究转向实用研究,并非只是“纸上谈兵”。

与之相映成趣的是,文献型与事实型数据库的论文分布也是呈抛物线(尽管有点不规则),但其开口却是向上,并且顶点也是在1993年,从1991年的第3位、1992年的第2位跌至1993年的第5位,之后又攀到1994年和1995年的第2位;这可能说明1993年是我国数据库研究的一个“分水岭”,在此之前较注重数据库理论方面的研究,之后则更偏重实际问题的研究[(3)]。

3 数据库论文的主题综述

3.1 数据库理论与我国数据库建设 从表2看,1991~1995年数据库理论与我国数据库建设的研究可分为两个阶段:①兴盛阶段(1991~1993年):论文数量与百分比持续上升,1993年攀升至第2位,占27.6%,表明这期间我国数据库理论的研究是热点;②转型阶段(1994~1995):论文数量与百分比均呈现明显的下降趋势,1995年竟跌至第6位,仅占3.8%,说明我国数据库研究开始从理论问题转向实际问题。

此主题的论文主要论述了数据库的概念、分类、历史发展和90年代数据库的发展趋势,以及我国数据库建设的现状、存在问题及发展策略、趋势等。虽然世界上先进国家的数据库产业已有相当的发展,但在我国,数据库作为一个产业还只是一雏形,存在的是一个个建库的单位和孤零零的数据库[(4)]。因此,我国的数据库产业发展任重道远,吸收、借鉴国外数据库建设的经验是非常必要的。部分论文介绍了韩国、澳大利亚、日本、印度、德国、美国等数据库建设的兴起及发展历程,总结了值得我们借鉴的经验。

3.2 数据库技术 数据库技术是9个主题类目中各年论文最多的主题类目,5年共有94篇,占30.0%。可见数据库技术一直是最受关注的主题。

软件开发与系统设计是数据库技术中的主角。如MicrO C-CDS/ISIS软件、TRIP系统和Foxpro、ORACLE、Paradox数据库管理系统,以及在Windows(3.0)环境下开发的Superbase4图形数据库管理系统等。

随着信息技术及信息网络的飞速发展,数据通讯与交换日益频繁,CN—MARC成为研究者关注的焦点。目前围绕CN—MARC的讨论主要有两种观点:一是认为MARC格式有重复繁琐、结构复杂等不足之处,给软件设计与数据处理带来了一系列问题,已经落后于时代,阻碍了图书馆自动化与网络化的发展。因此,有必要对CN—MARC格式的存储形式和内容特征进行修改[(5)]。二是认为传统MARC格式具有更多的优势,其权威地位不容动摇。如采用CN—MARC格式,必将我国的数据局限在国门之内,阻碍国际社会的资源共享,违背遵循国际标准制定国家标准的初衷[(6)]。

3.3 各种类型数据库 需要说明的是:为了研究和理解的方便,本文把数据库分为文献型数据库、事实型数据库、书目数据库、光盘数据库、联机数据库、全文数据库以及多媒体数据库等,这些数据库之间也许有些交叉,但不影响本文的统计和分析。

各种类型的数据库是我国目前数据库研究最主要的内容,在所统计的论文中居第一位,总共占50.4%。

文献型与事实型数据库是目前我国建库的主要类型。其研究论文居各种类型数据库之首,占15.7%。据粗略统计,在1991~1995年的10种图书馆学情报学核心期刊的48卷期刊中,共论及全国科技情报声像资料联合目录数据库等42个文献型数据库,中国企业、公司及产品数据库(CECDB)等30个事实型数据库。论文内容主要是围绕这两种类型数据库的建库的必要性与可行性、建库思想、设计思想、实现途径、所取得的经济效益和社会效益、研制历程、发展现状与存在问题、发展对策、检索系统、基本内容和结构、质量控制、主题标引研究、服务方式、数据前处理工作实践等。我国目前研建的事实型数据库主要有成果库、产品库、企业名录、科研机构库、商情库、经济信息数据库等种类[(7)]。

书目数据库因其实践性非常强,一直是研究者感兴趣的主题。据统计,其排名在9个主题类目中始终保持第3~5位。而西文图书书目数据库又是重头戏,尤其是近来被越来越多图书情报机构采用的BiblioFile,频频出现在图书馆学情报学期刊中,内容涉及BiblioFile、使用指南、编目时常见故障及其处理、数据转换等[(8)]。

光盘数据库应用于情报检索仅10年,它不但很快普及于发达国家的图书馆,而且迅速打入中国等第三世界国家的信息市场,对联机系统产生了很大的冲击。其研究论文主要是围绕MEDLINE等国外光盘数据库检索研究、利用现状、存在问题及对策、中文光盘数据库的制作以及光盘数据库对我国图书情报事业的影响等问题[((9)]。

联机数据库检索是我国科研人员了解世界学术动态的一条有效途径。但随着全球信息高速公路的建设,Internet网络的出现,联机数据库检索的需求明显下降。据统计,其研究论文也从1991年的13篇降至1995年的1篇。内容主要为:国际联机情报检索系统的进展、联机系统数据库大规模和正规化建设以及如何利用DIALOG系统中的《引文索引》数据库、总索引文档DIALINDEX(编号411)等工具查找所需文献的检索策略研究等[(10)]。

全文数据库也可算是研究者一直感兴趣的主题。除了1994年空白以外,1991~1995年都一直保持着3.4%~4.3%的百分比。此主题的论文不多,但质量高。如关于完全意义上的全文数据库的论述就非常切中要害,而关于全文数据库的制作方式、全文数据库的核心技术、全文数据库的技术进展和应用的论文则更是言之有物、予人启迪[(11)]。

多媒体数据库是近几年出现的新生事物。1994年、1995年才出现关于多媒体数据库的论文。其研究内容包括多媒体数据库、基于内容检索的图像数据库、使用超文本技术实现多媒体信息的超媒体数据库等[(12)]。

3.4 数据库的其它问题 随着我国数据库建设的深入进行,研究者开始把注意力转向数据库的其它问题,如数据库的版权保护、数据安全性、数据库用户教育等。尤其是近两年其数量明显增加,1995年就比1994年增加了5.4%。

数据库版权保护作为知识产权的一个新成员,正备受瞩目。我国的《著作权法》和《计算机软件保护条例》对数据库的版权保护目前尚无单独、具体的规定,因而探讨这方面的问题更具有不可忽视的现实意义。但这方面的论文目前多数仍停留在介绍国外(如欧共体、美国等)在数据库版权保护方面取得的进展,及提出加强我国数据库版权保护的一些建议[(13)],研究力度有待加强。

随着图书情报领域自动化高潮的到来,数据安全性问题应引起足够的重视。上海交通大学计算机中心研制的分级保护模式为管理信息系统设置了一层层数据和文件的保护屏障,有效地保护了其数据资源和程序资源[(11)]。

4 评价

上述统计分析结果表明:1991~1995年我国的数据库研究的重点是各类型数据库与数据库技术,并越来越倾向于实际应用研究。虽然近年研究论文的数量有所减少,但相对于90年代以前其质量却提高了。主要表现在研究内容的多样化、研究层次的深化以及研究策略的规范化等方面。

我国数据库研究中还存在着一些问题。一是研究力度不够。随着图书情报部门工作自动化程度的提高,数据库从业者的队伍不断壮大,相比之下,我国数据库研究论文数量则显得过少,这说明不少从事数据库工作的人员并未加入到数据库研究的行列中来。二是研究层次不高,深度不够。不少数据库论文停留在介绍性描述上,真正的研究论文并不多;涉及的主题很广泛,但都不够深入。

此外,有些问题被忽视了,如数据库用户教育对我国图书情报界来说还比较陌生,但它却是一个关系到某些数据库生死存亡的问题,其研究尚有待加强。数据库的短期行为、“死库”等问题也是当前困扰我国图书情报部门的大难题,而这些问题也被忽视了,不但有关基本主题的论文难得一见,就连打“擦边球”的主题也寥寥可数。众所周知,数据库是图书情报自动化工作的基础,倘若这个基础环节的连续性得不到保证而变成短期行为,好不容易建起来的数据库因数据库用户教育未跟上,无人利用而成为“死库”,那么图书情报自动化工作将无法发挥其应有的作用,我国的数据库建设与数据库产业将难以向更高的水平发展。

收稿日期:19970-01-14

Summary of the Research on Databases in China from 1991 to 1995

Pan Yantao

(Department of Library and Information Science,Zhongshan University)

[Abstract]Analyses 313 articles in the field of research on databases published in 10 core LIS journals in China from 1991 to 1995.Most of the articles were Published in 1991(81 articles),and few in 1994(51 articles).The large groups of articles deal with the database technology (30.0%),document databases and factual databases (15.7%).Theneglected areas are the short-time action about databases,the education of database user and the other types of databases,etc.CK

1 邱均平.我国图书馆学情报学研究主题趋势的定量分析.中国图书馆学报,1991,17(3):3~11

2 黄京茹.我国数据库文献的增长(1981~1990).图书情报工作,1992(2):12~16

3 程焕文.中国图书馆学信息学研究之文献计量研究.IFLA1996年大会论文,1996

4 张帆.中国数据库业透视.中国信息导报,1995(4):4~6

5 莫少强.新一代机读目录的设计与研究.现代图书情报技术,1994(1):13~17

6 陈俊华.也谈MARC格式——与莫少强先生商榷.现代图书情报技术,1995(4):20~23

7 吴家柱.中信所数据库的开发及建议.现代图书情报技术,1994(1):31~34

8 谢琴芳.基于BiblioFile光盘编目系统的西文原始编目.大学图书馆学报,1991(4):40~42

9 戚其秀.CD—ROM与我国图书情报事业.情报学报,1991,10(5):17~20

10 刘继昌.国际联机情报检索系统若干进展.现代图书情报技术,1991(1):25~27

11 邵品洪.全文数据库的技术进展和应用.现代图书情报技术,1993(4):6~10

12 游宏梁.基于内容检索的图像数据库.情报科学技术,1995(6):9~12

13 倪晓红.数据库版权保护问题.现代图书情报技术,1995(3):15~18

14 方正,钱湘香.管理信息系统的数据安全性.现代图书情报技术,1995(6):37~40

标签:;  ;  

1991~1995年中国数据库研究综述_数据库系统论文
下载Doc文档

猜你喜欢