积极推进社会科学数据库建设--论上海新图书馆社会科学功能的深入发展_上海图书馆论文

积极推进社会科学数据库建设--论上海新图书馆社会科学功能的深入发展_上海图书馆论文

积极推进社科数据库的建设——二论上海图书馆新馆社科功能的深层开发,本文主要内容关键词为:上海论文,新馆论文,图书馆论文,功能论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

社科数据库的建设是现代化图书馆社科功能深层开发的通途之一。社科数据库是相互关联的社科数据的集合,是电子形态的社科信息或知识,通常由数据采集、数据预处理、数据转换和数据建库等子系统组成,由数据库管理系统(DBMS),进行总体组织、存贮、检索、安全和数据一致性的管理,对分散于各种载体的有价值的社科信息,予以收集、整理、加工、编排,令其电子化、网络化、系统化、长效化,以求重组信息资源,优化文献结构,方便读者检索,共享网上资源。上海图书馆新馆通过积极推进社科数据库的建设,将促进社科文献的有序化,提高社科信息资源的利用率;拓展解决“藏”与“显”矛盾的有效途径,加快馆藏资源电子化、数据化、网络化进程,使文献资源的标准化、规范化工作走上一个新的台阶;依赖于计算机辅助标引大大提高文献标引的准确率和标引速度,推动文献工作的自动化,加大资源共享的广度和深度,以致于进一步变革图书文献的管理方式和服务方式,让现代通讯技术、网络技术和数据库技术更好地为现代化图书馆的腾飞奠基。社科数据库的建设对于现代图书馆的社科功能的深层开发至关重要。

1 从“计算机文化”的高度推进社科数据库的建设。今天, 社科数据库的建设是置于“计算机文化”的大背景下展开的,这既决定了社科数据的时代特点和文化立意问题,又为社科数据库的建设提供了技术保证。电子计算机向社会文化各领域的全方位渗透,拓展了“计算机文化”的新时期。今天,以电子计算机为主要代表的电子技术水平,已成为衡量一个国家科学文化水平和现代化水准的重要标志。由于计算机管理系统的不断改进,社科数据库的建库效率大为提高,社科图书文献信息的传递进一步加快,其公共查询功能趋于增强,为读者和各种用户提供更为方便、更为友好的图形界面和多种检索途径,使读者和用户尽可根据自己的爱好和习惯,顺利地检索所需的文献信息。一些配有电脑的专业读者,还可以在家中通过INTERNET网浏览器查询所需的数据库信息,大大提高了工作效率。今天,先进的社科数据库的建设依赖于电子计算机的新的平行结构、新的存储装置、新的程序语言和新的操作方式,使信息采集、存储、处理、通信和人工智能结合在一起,借助于计算机所具有的类似人的推理、学习、联想和解释能力,帮助读者基于已有的社科图书文献信息,进行判断和决策,开拓未知领域和获取新的知识。社科数据库的建设已与电子计算机知识处理和智能处理功能的增强互为促进,两者的链式反应使电子计算机更好地成为今后开发各种人工智能系统和研究思维科学的有效工具,使社科数据库的建设与强化专家系统、改造知识工程、重新组织知识创新系统具有更为紧密的联系纽带。

在“计算机文化”大背景下,各种数据库的建设有蓬勃发展之势。总部设在美国俄亥俄州的OCLC联机计算机图书馆中心(Online ComputerLibrary Center,Inc.)向世界上63个国家和地区的24000多个成员馆进行辐射,积极提供联机信息检索服务。OCLC第一检索服务拥有的数据库达五六十个,属于自己的数据库有4个,大部分为租用。 它们涵盖社会科学、人文科学、自然科学和工程技术科学等,有文献目录、摘要、全文和馆藏图书馆的标识符、涉及书籍、期刊、文献、影片和计算机软件等。每个数据库所提供的检索类型不完全相同,可在各类数据的联机说明中获得帮助。OCLC的年订费依用户所需同时登录的数量和选择的数据库而定。用户可在常用的数据库上按年购买检索,在不常用的数据库上按次购买。加拿大的ISM信息系统管理公司, 是一家国际性数据服务公司,它的数据库区别于OCLC的集中式数据库,即把一种书分散记录于不同的数据库。台湾的“央图”有100万条记录加入ISM的中文数据库。着眼全球,综合性的图书馆与情报科学数据库还有总部设在伦敦的英国图书馆协会出版公司的LISA(Library and Information Science Abstracts)、总部设在德国法兰克富的ISC(Information Scienceand Practice)、总部设在美国亚历山大市的ISA(Information Science Abstracts)、加拿大多伦多大学图书馆建立的CATSS(Catalogue Support System)等。近年来书目数据库发展迅速,韩国国立中央图书馆所藏272 万册图书, 其中有168万册韩文书目已全部输入电脑,至1997年底,全部期刊数据建库。韩国国家图书馆的120万册图书已全部完成书目建库。 日本国立国会图书馆藏书达1200万册,其中日文图书已大部分完成书目建库,1986年后的西文图书书目也已输入计算机系统。该馆资料查询,可以通过卡片、书本式目录、光盘检索和联机检索等4条途径进行。 80年代以来,中文书目数据库建设方兴未艾。北京图书馆的《中国国家书目》(光盘)、中国科技信息研究所重庆分所开发的《中文科技期刊数据库》和中国科技信息研究所等单位开发的《中国科技文献数据库》等都十分引人瞩目。1997年年初,上海市图书馆学会还就书目数据库建设问题举行了专题学术讨论会。在社科数据库方面,国内有影响的有中国人民大学书报资料中心推出的《报刊资料索引》光盘和《专题目录索引》光盘。《报刊资料索引》光盘汇集了1978—1995年人大书报中心编选的《报刊资料索引》全部题录内容,包括马列主义、哲学、社科总论、政治、法律、经济、文化、教育、体育、语言、文艺、历史、地理、科技、出版等,社会影响较大。此外,还有上海交通大学电脑应用技术研究所与北京大学法律系开发的《中国法律信息库》,收有国家、各省市自治区、特区开发区以及沿海城市的各类法律文件共17000多件, 包括宪法、行政法、经济法、民法、劳动法、环境保护法、科教文卫法、军事法、刑法、诉讼法和涉外法规等。其中《中国对外经济贸易法律库》、《中国判例库》和《国际经济法库》中的部分法规设有英文版。中国人口情报研究中心和中国索引学会开发了《中国人口与计划生育文献数据库》,较为全面地反映了我国人口与计划生育的现状,为该领域的学术研究和交流提供了重要的文献信息。

上海图书馆开发的《中文社科报刊篇名数据库》是《全国报刊索引》的新一代电子版检索工具,它收录全国哲学社会科学期刊3800多种,报刊162种,内容涵盖马列主义、毛泽东思想、哲学、社会科学、政治、军事、经济、文化、科学、教育、体育、语言文字、文学、艺术、历史、地理等。建库采取核心期刊全收、非核心期刊选收的原则,年更新量约20余万条,自1993年1月起,累积数据50万条, 为社科研究工作者提供了极大的方便。由上海图书馆上海科技情报研究所研制、长江计算机集团开发的《中国古籍善本影像查阅系统》在国内外率先进行古籍数字化的尝试,为建立馆藏古籍善本数据库奠定了良好的基础。

2 从“网络时代”的高度推进社科数据库的建设。 从根本上说,社科数据库的建设是网络时代的命题。网络时代的到来为社科数据库的建设既提出了需求,又提供了可能;网络观念的出现和演进为社科数据库的建设赋予传奇和伟力;网络文化的形成和发展为社科数据库的建设奠定了文化基础;网络经济的崛起为社科数据库的建设同时亮出了“挑战”和“机遇”;网络空间的拓展为社科数据库的建设延伸了发展空间;网络技术的长足进步对社科数据库的建设给予了技术支撑。有一种提法值得回味,就是“19世纪是铁路的时代,20世纪是高速公路的时代,21世纪将是网络的时代。”铁路的时代和高速公路的时代都给人类社会的经济——社会——文化的发展带来过繁荣,世纪之交所形成的网络时代在给人类社会带来新的竞争烦恼和压力以外,终将使人们迎来新的辉煌。杨桃源和刘和安在《网络化建设:“中华民族21世纪文明的生命线》(《瞭望》新闻周刊1997年第47期)一文中认为,网络可以联络分散各处的信息系统,使所有资源(包括人、计算机、信息)能够为需要它们的所有人共享,人们得以克服地理位置的局限而协同工作。网络的最巨大的功能,就是以计算机为手段,把人类现有的一切信息加速到电子的速度。如今,Internet已经连结了全球6500多万台计算机主机,130万个大小网络。这样,世界便成了一张无边无际的网。据IBM预测,到下个世纪,全球将有1亿台电脑和上百万个电脑网络与互联网相通,用户将上升到5亿。“三金工程”的出台,迅速引发了中国网络化建设的热潮。“金桥工程”是以卫星、通讯电缆、光缆、微波等多种传输手段,实现全国性甚至跨国的计算机联网,其目的是建立我国国家公用信息平台,为国民经济各部门和国民生活各方面的信息交换、共享提供一条“准高速国道”。“金关工程”是为了解决我国外贸工作中的积弊,建立一个跨部门的网络,把海关、外贸部、国家税务总局、国家统计局、外汇管理局及银行联接起来,实现外贸领域的高效管理。“金卡工程”是为了加速我国货币电子化的进程,减少现金货币的发放和流通量,缩短货币的流通周期,加速货币的沉淀速度,并将逐步发展成为个人与社会交往的全面证明,如个人身份、经历和储蓄凭证等。有中国特色的网络化建设区别于西方国家走的一条先把电话、信息、电视分割建网,然后再集成的路子,从一开始就既考虑到公众对电话通信的需要,又考虑到社会和国民经济各部门对数据、图像等非话信息通信的需要,加速建设完整统一的现代化的全国公用通信网,保证其高效与畅通。有人预测,到2000年中国城镇1亿家庭中将会有近10%拥有电脑,而其中50%以上将会上网。在中国网络建设的热潮中,上海网络建设的进程十分顺利。上海信息交互网的开通,在全国率先建成地区性信息交互网。上海国际经贸电子数据交换网技术方案已通过鉴定。上海社区服务网试点范围、区域已确定。上海社会保障网已编制了建设总体方案。上海金卡工程进入全面推广使用阶段。1998年1 月全面开通的上海科技网不仅成为上海最大的科技基础设施之一,而且成为具有高科技含量的城市基础设施。它的全面开通,缩短了与其他国际大城市的差距,提高了城市信息化水平,为发展上海城市信息高速公路积累了经验,为上海建成信息港的目标迈出了可喜的一步,打下了良好的基础。社科数据库的加速建设将依托于网络建设的迅速推进,计算机网络的进一步扩展、国家公用信息平台的建立、信息传递时空条件的进一步改善及其信息共享的深层化演进,使社科数据库的建设、开发、使用及其进一步优化成为现实。

如何从“网络时代”的高度推进社科数据库的建设,专家学者见仁见智,献计献策。上海图书馆的社科数据库的建设可从中吸取养料,予以借鉴。有的学者认为,分布式数据库管理系统是未来网络文献数据库包括社科数据库发展的趋势。分布式数据库管理系统不同于集中式数据库管理系统,也不是简单的数据的分散管理,而是分布式数据库管理系统机制通过系统目录实现的;对分布式数据库管理系统环境与工具的选择应从信息系统的要求与产品的特性出发;汉字分布式数据库管理系统在网络上传递信息,汉字将会成为通信上的“瓶颈”,对于解决这个“瓶颈”问题传统的词切分模式和单汉字模式都会无能为力,应该根据汉字本身固有的特性,即汉字属性,构造一种新的模式,而汉字定位码值等值算法,是利用汉字属性进行查重的一种尝试,具有可操作性和新颖性。有的专家强调了高质量社科书目数据库建设的重要性,认为社科数据库质量的高低、数量的多少,决定着图书馆自动化网络水平的高低、作用的大小,因此,建立高质量的完备的社科书目数据库是亟待高度重视的问题。书目数据库的标准化是提高社科数据库质量的重要环节,要促进数据通讯格式的标准化,使之符合UNIMARC或CNMARC;促进数据项目的标准化和数据建立工作的标准化,对数据准备、数据录入、数据核对等阶段建立严格的工作规范和责任制;注重查重、著录、标引等步骤的质量,制定相应的标引策略。还应做好数据库的维护工作,及时对数据进行删除、修改追加、恢复与备份等,确保数据完整无误,增其价值,延其寿命。在建立社科期刊数据库方面,有关著述认为要综合考虑期刊的基本出版标准、编辑内容,文献的可追溯性、作者的国际性以及与之相联系的引文数据等,以形成数据库评估优势。有的学者还进行数据库管理系统的特征问题研究,包括数据的独立性、完整性、安全性和易存取性等。今天,全世界建立了数以百万计的各种数据库,形成了巨大的信息资源。90年代以Internet为龙头的网络技术和数据库技术迅速发展,在基于Internet通信标准和万维网服务模式的技术背景下,数据库的特征探索有利于社科数据库的有效建设。

上海图书馆的社科数据库建设理应基于较高的逻辑起点,从电子图书馆的发展趋势着眼,立足于网络上电子出版物日益增多、网上数据进一步规范、网上全文信息检索服务系统不断开发、全文数据库、事实数据库、数值数据库、术语数据库、书目数据库和多媒体数据库等数据库类型的连绵发展、网络信息检索工具日趋完善、网络上电子文献传递和版权保护日渐统一,积极发展联机数据库和光盘数据库,努力提高数据库标准化程度,有效改进信息质量,优化资源配置,提倡“及时服务”,把数据库资源建设与文献信息开发有机结合起来,进一步拓展社科数据库的数据集散的枢纽功能、数据的检索功能、联机与远程服务功能、文献管理、研究与分析功能、数据加工的增值功能。文献型数据库比数值型数据库和事实型数据库的结构复杂,数据量大,建库要求高,理应在文献型社科数据库上下功夫,积累经验,扎实推进。还应研究探索层次型数据库、网状型数据库、关系型数据库、集中型数据库系统和分布式数据库系统,在社科数据库的建设中关注信息的存在形式和物理存放空间,更好地建设动态推进的、有利于深层开发信息资源的社科数据库。当北京电信局把光缆铺到北京图书馆机房以后,北图成功地完成了接口互联,大大改善了数据上网条件,并与中国公众多媒体信息网和因特网沟通,于是,有关专家提出了数据库建设的“纵横工程”思考,即横向四大方阵,包括中文图书块、外文图书块、报纸刊物块和专题文献块,纵向三个层次,包括书目数据库建设、篇目数据库建设和全文数据库建设,这一战略思考值得上海图书馆借鉴。上海图书馆可以从自己的馆藏文献优势出发,提出突出重点的具有上图特色的数据库“纵横”建设开发计划。同时,可从专题文献和特色文献入手,抓好特色数据库的建设,使资源共享背景下的一般文献建库与特色文献建库紧密相连,书质资料建库与非书资料建库有机结合。以建库形式、建库方式、数据库建设及其重组等为抓手,积极推进社科数据库的发展,已是上海图书馆的题中应有之议。

3 从“数字化生存”的高度推进社科数据库的建设。世纪之交,社科数据库建设的现实性意义和前瞻性意义的认识来自“数字化生存”的共识,社科数据库建设的深沉思考来自“数字化生存”的进一步解读,社科数据库建设的自觉推进来自“数字化生存”的谋略。美国麻省理工学院教授兼媒体实验室主任尼古拉·尼葛洛庞帝是数字化生活方式杂志《连线》的资深专栏作家,他在《数字化生存》(海南出版社1996年12月第2版)一书中向读者介绍了有关数字化理论和设备的知识, 传递了有关数字化生活方式和数字化的各种信息。“数字化生存”理论认为,计算不再只和计算机有关,它决定我们的生存。人类的每一代都会比上一代更加数字化,在今天的数字化环境中,新的一代正脱颖而出,摆脱了许多传统的偏见。如果不想与时代脱节,就必须重新开始学习生活,去深刻把握“数字化生存”的含义。“数字化生存”理论的核心是:比特,作为“信息的DNA”, 正迅速取代原子而成为人类社会的基本要素。比特与原子遵循着完全不同的法则。比特没有重量,易于复制,可以以极快的速度传播。在它传播时,时空障碍完全消失。原子只能由有限的人使用,使用的人越多,其价值越低;比特可以由无限的人使用,使用的人越多,其价值越高。工业时代可以说是原子的时代,它带来的是机器化大生产的观念,以及在任何一个特定的时间和地点以统一的标准化方式重复生产的经济形态。信息时代,也就是电脑时代,显现了相同的经济规模,但时空与经济的相关性减弱了。无论何时何地,人们都能制造比特。信息技术的革命将把受制于键盘和显示器的计算机解决出来,使之成为我们能够相互交谈、共同旅行,能够抚摸甚至能够穿戴的对象。这些发展将改变我们的学习方式、工作方式、娱乐方式——一句话,我们的生活方式。数字化生存代表的是一种生活方式、生活态度以及每时每刻都与电脑为伍。在广大浩瀚的宇宙中,数字化生存能使每个人变得更容易接近,让弱小孤寂者也能发出他们的心声。0或1,似乎已成为世纪之交文明的象征,以至于有的学者深刻地领悟到,信息化的最为新奇之外,就是将人类的一切信息都以计算机语言的0或1的二进制数字来表达,包括声音、图象和文本。0或1,便是人类21世纪文明的报到窗口。这是人类文明在数字基础上的一次史无前例的科学整合,其科学含义和哲学含义有待科学家和哲学家去深究,但人类文明经过这次数学整容后所发生的巨大变化是人人都可感受到并有望受惠于其中的。当然,今天谈论“数字化生存”必然要涉及“模糊数学”问题。模糊数学把特征函数值从0,1扩大为[0,1]区间上的连续无穷值,从而,把“属于”关系数量化了。模糊数学出现后,“数学模型”“模糊化”了。这种“模糊化”,并不是说数学模型变得模糊不清了,而是说数学模型的功能从处理“精确”现象扩大到处理“模糊”现象,而这种“模糊化”对于模糊现象来说,是寓“精确”于“模糊”,恰恰正是“精确化”。

0或1,神奇地推出了“数字化生存”的重大命题;[0,1]区间上的连续无穷值,又从“模糊—精确—模糊”的辩证认识中深化了“数字化生存”的内涵。从“数字化生存”的高度积极推进社科数据库的建设,无疑使社科数据库的建设置于时代的高层位上,同时赋予其鲜明的发展个性。在传统的工业经济时代,经济活动的主要对象是物理要素,社科知识的载体主要是书本资料和相应的非书资料。而在“数字化生存”背景下,数字化经济形态迅速形成,在经济活动的主要对象中涌入“0 ”或“1”,人类的智慧包括社科知识与信息进入计算机网络, 邀游于国际互联网,以光速进行传播,社科数据库的建设从一开始就带上“数字化生存”的新的生存特征,社科数据库的发展从初期就纳入了“数字化经济”相一致的轨道。在社科数据库的建设中,客户/ 服务器数据库技术受到欢迎。ODBC作为广泛用于客户/服务器数据库的中间件, 使数据库应用程序能跨越多个数据库平台,实现了数据库之间的可互操作性。如果就先前的数据库仅仅实现数据共享的话,那么数据库服务器上的存储过程在一定程度上实现了程序的共享。软件系统生命周期、结构化方法、原型法和面向对象方法等备受关注。数据库设计的ER方法被细化为基本ER构造、高级ER构造、建立ER模型的方法、把ER模式转换到关系模式等。数据库的规范化原理和方法引起重视,涉及范式、规范化框架和规范化算法。数据库的完整性、安全性、可溯性等提到了议事日程。有识之士还主张加强宏观控制,避免社科数据库重复现象;让用户参与开发,使社科数据库更好地体现“以用户为中心”,满足用户需要;加大资金投入与人力投入力度,扩大社科数据库面向社会的开放度。同时,可采用联合建库的方式。加快社科数据库的建设;采用延伸实用型子库的方式,有效扩大社科数据库的容量;采用突出地方特色的方式,让社科数据库更好地为国际大都市的社会—政治—经济—文化的一体化发展服务。据介绍,要根据最近对全国数据库和电子信息网络资源的调查结果,我国目前数据库的内容已由科技领域为主转变为以经济和社会领域为主,而社科数据库的进一步发展离不开向产业化商品化、标准化法制化、高速化巨型化演进的世界潮流,要克服无序状态,力戒短期行为,优化资源配置,加强数据库检索系统的理论思考与实践探索。

上海图书馆的社科数据库的进一步建设将充分反映“数字化生存”的生存方式及其相关的智慧特征。上海图书馆是金图工程上海地区网络中心节点、国家数字图书馆计划中地区分中心、上海信息港十大应用系统之一、上海公共信息网(宣传系统网)网管中心、CHINAINFO 的地区中心等,其数字化工程包括社科数据库的建设刻不容缓。其近期数字化项目是抓紧馆藏古籍一级藏品和二级藏品的扫描制作,前者约达20万拍,后者计1345种7386册,约合517020拍。积极建立剪报数据库、产品样本数据库和中国学术会议全文数据库,以上网和光盘两种形式进行服务。到本世纪末,将进行书目数据库联网检索,重点解决OPAC数据的3W浏览和查询机制,并将涵盖上海地区区县图书馆的馆藏书目数据。还将着手近代上海历史图片数字化和建库工作,汇集20万幅历史图片;尝试建立历史文献图录数据库,对中国古籍善本基本建成模型,完成部分数字化工作,积极提供网络服务,努力解决汉字环境、机读格式、目录组织和版本判别等问题;筹建多媒体声像数据库,进行旧唱片的数字化工作,并提供上网服务。同时,上海图书馆的社科数据库的建设置于数字图书馆建设的整体视野之中。数字化图书馆把分散于不同载体、不同地理位置的信息资源以数字化方式贮存,以网络化方式互相联接,提供即时利用,实现资源共享,优化服务质量,有利文献开发。数字化图书馆方案包括“馆藏资料的数字化、数据的存储和管理、数字式图书馆的访问与查询、图书馆服务的网络提供、版权管理”等方面,对软硬件集成平台、用户界面、网络和通信环境、主要载体类型的数字式等提出实施方案,重点进行古籍编目、版本鉴别及特藏的数字化工作。在数字图书馆的整体思考中推进社科数据库的建设有事半功倍之效。金技编著的《虚拟生存》(天津人民出版社1997年10月版)一书指出:数字化的最终结果就是虚拟化。由数字化带动的虚拟生存是人类有史以来生存方式最具革命性的变革。这一变革将改变我们当前的生活方式和行为格局。上海图书馆将从“数字化生存”和“虚拟生存”的高度推进社科数据库建设,加强社科数据库的针对性、无形性、涵盖性和可持续发展性研究,以社科数据库的建设成果进一步赢得新馆社科功能的深层开发空间。

收稿日期:1998—06—09

责任编辑注:本文第一部分发表在本专题1998年第5期19页。

标签:;  ;  ;  ;  ;  ;  ;  ;  

积极推进社会科学数据库建设--论上海新图书馆社会科学功能的深入发展_上海图书馆论文
下载Doc文档

猜你喜欢