应加紧建设中国教育数据库,本文主要内容关键词为:中国教育论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
发达国家已步入信息时代。发展中国家,乃至欠发达国家则在奋起直追。有人称,这叫做“追赶信息时代”。[1]发达国家已经走到了“没有哪一个专题领域没有被文献目录数据库所复盖”的地步。[2]而在我国,数据库建设的水平只能说还处于世界数据库发展总水平的初级阶段。
国家计委、国家科委1995年组织完成的《全国信息资源调查分析报告》指出,我国“数据库的发展水平仍然很低。数据库的规模、容量虽然有了较大提高,但不及发达国家70年代水平”[3]。这份报告也显示,在教育科学领域里,中国教育数据库建设水平更低,远落在科技和经济部门之后。因此,加紧建设中国教育数据库的必要性和迫切性,已直逼我国教育信息工作者。
一、中国教育数据库建设的现状
我国教育领域数据库的建设,总的说来,是起步早,进展慢。1980年,我国开始建设数据库,有中国科学院化工冶金研究所建的“工程化学数据库”,中国科学院上海有机化学所建的“化学文献数据库”和“谱图数据库”。1983年,清华大学牵头,联合国内数百家高校也开始建设我国第一个教育数据库——“中国大学学报论文数据库”。当时建设该库的目的是为了适应改革开放形势,开展国际学术交流,向外国用户提供有关我国高校科研状况的信息,扩大我国高校学报在国际学术界的影响。为此,该库是个英文文种库,其磁带版在国际BDSIRS、DIALOG等联机检索系统上均有正式的检索文档,光盘版(CUJA-CD)也于1995年10月问世。
随后,上至国家教委、高等院校,下至地方教科所,乃至中小学图书馆和社会上有远见的信息服务公司,纷纷参与到各种教育数据库的建设中来。国家教委教育信息中心庞大的教育统计数据库自不必说,另外,国家教委条件装备司和全国高校图工委联手,早在1989年即着手建设“全国高等学校图书馆事实数据库”,该库收集了全国普通高校图书馆有关藏书结构、人员结构、年度经费等基本数据;国家教委教育管理信息中心建设了“国家教育法规数据库”,该库收集了我国1949-1995年3月发布的国家有关教育的法律、法规和规章。高等教育出版社建设的“中国教育信息库”则全面收集了中国普通高校、成人高校、中等技校和授予博士、硕士学位的单位,以及全国教授和中国汉语对外教学等各方面的信息资料。该库出版光盘版,中英文皆备,从某种意义上说,它又是我国教育方面的第一张光盘图书,向国内外公开发行。
山东省教科所建立的“战后世界教育发展统计资料数据库”,属于教育宏观研究信息库。该库能向访问者提供1950年以来全世界131个国家的51项有关教育及社会经济发展指标的统计数据。集美大学、北京大学高教所和厦门大学高教所联合研建的“全国高教研究期刊论文管理信息系统数据库”,乃是与西安交通大学科研处研建的“高教研究文献微机管理系统数据库”类似的高教研究信息库。全国现有1054所高校,设有700多个高教研究所(室),且大多编辑出版了高教研究期刊。因此这类数据库受到高教研究界的欢迎。也有若干普教研究数据库在上海、天津、四川等地相继建立。诸如上海杨浦区教育学院研建的“教育文献计算机检索系统”等。
特别值得一提的是,清华大学光盘国家工程研究中心自1996年1月起,开始出版中国学术期刊(光盘版)数据库,涵盖国内中英文2000种核心期刊和2000多种专业特色期刊,配以最先进的全文检索和查询管理软件。该库分理工、医疗、卫生、农业、经济法律、教育、政治、文史哲和社科综合等8个专辑,按月定期出版。每个专辑含优秀期刊500种。每期总文字量逾1亿。可以预期,中国学术期刊(光盘版)数据库的建设与发行,必将是对中国教育数据库建设的巨大推动。
随着信息化进程的深化和数据库商业服务的意义逐渐被人们所认识,非教育领域的企业家也在借用数据库为手段,将经济触角深入到教育信息领域中来。大庆市三联信息中心及其在1996年3月开通的“全国教育信息网”就是一个典型例子。该中心于1993年1月创办,相当于美国的一家信息销售商(Vendor)。当初,它只是与国家信息中心、国家计委及港澳和企业的有关信息部门或数据库联网,编辑、发布、销售经济信息,并“取得非常显著的经济效益和社会效益”[4]。经营成功后,该中心邀请《上海教育》、《天津教育》等国内10家教育报刊充当联合主办单位,全国百家省级重点中学为协办单位,建起了“全国教育信息网”。该网常务主编蔡守诚教授提供的资料表明,该网信息来源基本上是主办单位和特约撰稿人提供的文字书面稿件和与国家信息机构(数据库)联网获得的信息。他们尚没有自己的教育专题数据库。但这家经营性的教育信息网络的创办,必将刺激用户对教育信息的需求,从而推动我国教育数据库的建设和发展。
尽管我国教育数据库建设在短短10余年中已经取得了很大进步,但差距也是十分明显的,真正属于教育数据库的数量不容乐观。以国家科委、国家计委去年最新数据库摸底调查为例,如若将1038个数据库按其收录内容分类,属文教类的数据库竟只占6.36%(如表1所示),如果去掉文化类的,那么,真正属教育类的数据库肯定还不足6.36%。相比之下,科技类、计划经济类、商业贸易类数据库均保持着强劲的发展势头。除观念等因素外,上述3个部门或领域建设数据库的资金相对比较充裕可能是一个重要原因。
表1 我国数据库按其收录内容分类的分布状况
部门
数据库数量 占总数比例(%)
党政48 4.62
劳动福利27 2.60
军事5 0.48
计划统计
137 13.20
财政金融52 5.01
文教66 6.36
科技221 21.29
邮电新闻43 4.14
卫生体育36 3.47
商业贸易
183 17.63
农林57 5.49
资源
12 1.16
能源
22 2.12
交通运输39 3.76
轻工6 0.58
冶金3 0.29
建筑环境34 3.28
机械电子29 2.79
航天
18 1.73
合计 1038 100
综上所述,我国教育数据库在国内诸行业数据库的开发和建设中,属于较弱的一个领域,亟待规划、协调、投资和开发建设,以迎接教育跨世纪发展对信息需求的挑战。
二、加紧建设中国中文教育数据库势在必行
有识之士认为,在“信息高速公路与中国”的问题上,首先影响我们的是教育系统。[5]这是因为,教育系统是信息资源开发的主力军,这里集中了我国大量高科技人才,有极其丰富的信息资源;教育系统又是最大的信息用户之一,是信息高速公路最大的受益者之一。为说明我国教育界应如何面对国际社会信息化浪潮,先简述一下美国创建“国家科研与教育网络”的历史和经验,也许不无裨益。从中可明显看出,信息资源和数据库建设在其中占有极其基础的地位。
1.美国“国家科研与教育网络”(NREN)的经验与启示 美国“国家科研与教育网络”(National Research and Education Network,简称NREN),是一种巨型电子计算机系统,旨在使全国各地的科学家、企业家、教育工作者乃至学生,都能借以相互进行交流,并得以利用范围广泛的研究工具和信息资源。这种共享的国家远程通信网络,在美国已存在了数十年,确切说肇始于1969年。当时,美国国防部所属的国防尖端研究项目署(ARPA)资助并首次成功开发了原始分组交换式远程通信网络。此项目原名“尖端研究项目计划署网络”,立题于1968年[6],最初目的是使地理上分散的科研人员得以科研资源共享,办法是把各地不相容的计算机网络联接起来。结果由此产生了一个副产品,即形成了以大学、政府部门和民间的一些科研机构为主干的联系网络,当时称作ARPANET,亦即今天Internet的基础。
经过10多年努力,差不多到1983年为止,美国约60%的网络接通了ARPANET网。鉴于在网上所传输信息总量的绝大多数为科研人员所占有,于是,国防部开始设法放松对它搞起来的ARPANET网际通信的管理。第一个步骤是与军事研究有关的通信归并到军用网络(MILNET),这是一个受严格限止的分立网络,而ARPANET则专作科研与教育的网络通信。1985年美国国家科学基金会接手负责ARPANET网际协调关系,并开始拨款支持该会自己的NSFNET,这就是美国国家高速远程通信的基础。它一开始就联通了由国防尖端研究项目署负责的6个超级计算中心,随后迅速扩展并联网了全国各地10多分中心。[7]每个分中心就是地方网络的中心枢纽,而地方中心枢纽又由在网的大学网络组成。1988年NSFNET网络正式就位,从而取代了原来国防部的ARPANET,后者于次年停用。ARPANET网在1983年开始时联接有60个局域网,而1991年的NSFNET(亦即Internet)则已经拥有700个局域网,6000台主机,估计用户为100万户。这样一来,绝大多数局域网实现了远距离联机、文件传递、互通、电子邮件以及其他多种电子信息服务。Internet的确成为了一个网络。
在Internet网发展之初,美国联邦政府、国会、国家科学院、大学和私人部门,都把目光转向解决与网络使用有关的问题,设想建成一个“用户界面友好、统一、高速、复盖全国的研究网络”。因此,在最早的讨论中,人们围绕网络建设想的是创建一种“国家研究网络”(National Research Network,简称NRN)。不过到1989年,网络的提议者们开始觉得应把“教育”加进名称之中。[8]于是,自1991年起,计划将Internet部分改建为“国家科研与教育网络”。直到现在,联邦政府研究Internet协调委员会(FRICC)一直在领导着这一过程。
从目标上看,美国“国家科研与教育网络”的基础目的有三:第一是建立一个“连续24小时的高品质的”网络,并成为美国先进的信息工程的永久性基础。它能为工作在联邦政府、大学和科研部门、私人部门的科学家、研究者、教育工作者、图书情报工作者等提供广泛的联络手段和资源。就国家目标来说,NREN要能实现广泛的国家目标,诸如提高国家竞争力、生产率、技术转移能力等等。第二是向更多的用户提供超级计算机和提高一切网络资源的利用率。按专家估计,NREN将会把全国分散在各地的信息资源联结为一体,形成一个相当紧密的电子信息永久基础,用户可方便地访问大型数据库,使用电子信箱,参加电子会议,利用电子图书馆和利用远距离的原来无法利用的贵重仪器设备。第三是技术目标,即NREN对用户来说是便捷畅通的,为此要求整个网络达到高度的标准化和友好的用户界面。
美国Internet网络,特别是NREN网络的诞生和发展给我们的启示,至少有以下5点:第一,美国信息高速公路的出现,是提高效率和资源共享需求的结果。第二,建设信息高速公路,或者国家科研与教育网络,前提之一是首先要将传统信息资源电子化、计算机化。这也是为什么数据库产业在美国如此发达的原因。第三,建设“国家科研与教育网络”的重要目的,是将全国分散在各地的信息资源用计算机网络联结为一体,以便实现提高效率和资源共享。第四,国家要从立法、投资和统一管理等方面给予支持。第五,要有较高的电话和家用电脑普及率,这是产生和实现资源共享要求的技术基础。
2.要有效利用“中国教育和科研计算机网”,必须加紧建设中国教育数据库 早在1986年全国计算机应用工作会议上,我国就确定了“七五”期间重点建设12个国家级信息系统,但其中没有教育信息系统。而且,在我国信息系统基础建设过程中,普遍存在的问题是重硬件建设、轻软件建设。比如,国家在“七五”期间为建设上述12个大型信息系统,共投资200亿元人民币,而用于数据库的投入则不足10亿元人民币。[9]不容置疑,国家在教育数据库上的投资更少,因而在教育数据库的建设上欠帐更多。
经过“八五”期间的努力,由国家教委主持的“中国教育和科研计算机网”(CERNET)示范工程,已于1995年12月20日通过国家验收。这是一个由全国主干网、地区网、校园网三级结构组成的教育和科研网络。与其联网的高等院校已逾百所,覆盖范围遍及除西藏、台湾和港澳地区以外的其他所有省市自治区。无论是主干网速率、覆盖区域,还是与其联网的单位数量,CERNET都是目前我国最大的计算机网络。
“中国教育和科研计算机网”示范工程的建成也说明,在教育领域同样严重存在着“数据库建设落在信息网络现代化后面”的现象。国家计委主任陈锦华最近指出:“在信息产业发展中,设施建设和资源开发应该保持合理比例,协调发展。信息设施和设备好比‘路’和‘车’,信息资源好比是‘货’。只有路和车,没有货来载,信息系统运行不可能有效。因此,要把电子数据库等信息资源的开发利用,即数据库信息业的发展放到重要位置。”[10]如果说,信息产业的发展归根到底取决于信息用户,那么,教育和科研网络的最后成功和有效,在某种意义上也要取决于科研与教育信息资源的开发,即教育数据库和科学数据库的发展和利用。
3.中国教育信息资源极其丰富,亟待开发和利用 从本质上说,信息资源产生于自然界的运动和人类社会的实践活动之中,乃是人类知识和智慧的源泉。所谓中国教育信息资源,指的是中国人民教育活动中各类信息的总称。中国是一个人口大国,即使不含学前教育,我国在在校生人数、学校数量、教师数量等方面,均居世界之冠。正因为如此,联合国教科文组织出版《世界教育报告》时,在“地区表格”栏目下只有中国和印度为单列国家,与南亚、东亚、南非、阿拉伯国家、加勒比地区、最不发达国家、发达国家等并列。[11]中国应当而且可能成为教育信息大国。
就信息资源的类型来说,有许多种,诸如正式记录型信息源、实物型信息源、思维型信息源;先导信息源、实时信息源、滞后信息源;原始信息源、加工信息源(加工信息源按加工深度又可分为二次信息源、三次信息源)等等。事实上,世界各国教育数据库均以积累和存储滞后信息资源,或称“置后信息资源”为主干。[12]比如,美国著名的ERIC教育数据库,提供的即是有关教育诸学科的文献资料,内容覆盖普通教育、高等教育、幼儿教育、职业教育、科学数学与环境教育、特殊教育、农村教育、师范教育、教育测验与评估、城市教育、教育管理、阅读与沟通技巧、语言等等。[13]如果按此模式,中国教育信息资源依然是一座基本上没有得到系统开采的富矿。
4.建设中国教育数据库是中国教育事业驶向国际信息高速公路的需要 随着“中国教育与科研计算机网”第一期工程的完成,可以预见,人们对中国教育数据库的渴求亦会日甚一日。中国教育改革和发展需要教育系统铺设教育信息高速公路,同时也需要尽快建设中国自己的教育数据库。很显然,中国教育改革和发展不能仅仅依靠国外的教育数据库,不能从美国的ERIC教育数据库,从欧洲ESA-IRS系统的教育数据库,从日本的教育数据库中找到答案,这是一方面。另一方面,中国教育驶向国际信息高速公路,势必激起国际教育界对中国教育的交流与研究热情。没有自己的教育数据库,不仅不利于学术与信息的交流,而且从输出信息产业的角度看,在经济上将是一项不小的损失。
5.建设中国教育数据库是中国教育改革和发展跨入21世纪的需要 信息高速公路正在改变人类的生活方式,也必将改变传统的教育方式。无论是在发达国家的教育中得到应用的多媒体技术、计算机网络、网上通信、远程通信,还是正在受到挑战的传统的课堂教学、课程开发、教学方法,以及教学行政管理,哪一样也离不开教育信息资源,离不开教育数据库。至于说到美国正在出现的“虚拟学校”,则更是如此。其所利用的教育信息、图书资料等,无论是实时的,还是滞后的,均是必须数据库化了以后才能实现。中国教育向21世纪迈进,必须关注信息现代化的冲击和影响,必须发展和建设中国自己的教育数据库。
注释:
[1] 朱奕宝:《追赶信息时代》,《中国科技信息杂志》,1995年第8期。
[2] Anders,V.,Automated Information Retrieval in Libraries,New York:Green Wood Press.1992,P.172.
[3] 国家计委、国家教委、国家信息中心编:《中国数据库大全》,中国计划出版社1996年版,第3页。
[4]傅威海:《王继华和全国教育信息网》,《光明日报》,1996年3月30日。
[5] 刘敬智:《信息高速公路与中国》,《光明日报》,1995年3月28日。
[6] Mcclure,C.R.,Bishop,A.P.,Doty,P.and Rosenbaum,H.,TheNational Research and Education Network(NREN),Norwood:Ablex Publishing Corporation,1992.
[7] Wintsch,S.,Toward a National Research and Eduction Network,MOSIAC,Vol.20,No.4,1989.Winter,P.34.
[8] Kahin,B.,Toward a Public Information Infrastructure:Information Policy and the Internt.Report Prepared for office of Technology Assessment,1990.
[9][13] 刘敏、陈捷:《中外经济技术信息查询指南》,企业管理出版社1995年第1版,第2页,第215页。
[10] 陈锦华:为《中国数据库大会》作的序言,中国计划出版社1996年第1版。
[11] 《世界教育报告》(1993),联合国教科文组织出版,中国联合国教科文组织全国委员会秘书处,1994年第1版。
[12] 王德荣:《置后信息资源的开发与利用应重视》,《光明日报》,1995年9月5日。