简评90年代中国文献数据库建设,本文主要内容关键词为:简评论文,中国论文,文献论文,年代论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
我国的科技文献数据库建设工作起步于70年代末期。到目前为止,大体可分为三个阶段。第一阶段为探索阶段,自70年代末期到80年代中期。计算机在图书情报工作中应用的观念和技术开始被介绍到中国,国内的一些单位成立了计算机应用研究组,配置了中、小型计算机,开始进行图书馆自动化的研究工作。建立和发展中文文献数据库就是其中的一项主要研究内容。中国科学技术情报研究所、中国科学院文献情报中心、国防科工委情报所等单位在这一时期都做了十分有意义的探索工作。虽然由于计算机的功能较弱,汉字的编码问题尚未解决等原因,使得当时的研制工作不可能建成一个实用系统,但是却从思想认识和技术方法上为以后的建库工作做了必要的探索。
第二阶段为研制实验阶段,自80年代中期至90年代初期。这一时期,计算机的各项性能有了很大的提高,汉字编码问题得到解决,计算机特别是微机逐步在国内的大中型情报单位得到较为广泛的应用,光盘技术有了实质性进展,一些单位开始引进国外的光盘数据库产品,提供检索服务。许多大型的图书情报单位开始研制并建立中文文献数据库,原来编制检索性期刊的一些单位也开始向建立文献数据库的方向发展。在国家的支持和各有关建库单位的共同努力下,许多数据库已初具规模,一些库已达到实用水平。这一时期,由于微机尚未普及,网络尚未建立,使得文献库的应用和服务工作受到限制。另外,又由于这一时期的建库工作都是事业型管理,因此存在着重研制,轻服务;重社会效益,轻经济效益的倾向。
第三阶段为市场化发展阶段,自90年代初至现在。这一时期,微机在国内图书情报单位得到了普及,微机的性能也日新月异,不断提高。国内建起了多家光盘生产厂家,建成了多个计算机通讯网络系统,并与国际互联网联通。一些情报单位购置了大型计算机设备,引进或研制了具有很强建库和检索功能的计算机数据处理系统。从管理体制上看,一些单位成立了公司,将数据库建设推向市场。人们对数据库的认识也在不断转变,一个具有实用价值的文献数据库不仅仅是一项研究成果,它更是一种产品,一种商品。数据库建设不仅仅是一项研究课题,而是一种产品生产和商品经营的过程。这些都为我国中文文献数据库建设工作的发展创造了条件。
下面对90年代我国文献数据库建设的状况谈几点个人认识。
1 企业化管理使数据库建设充满生机
90年代初,随着我国社会主义市场经济体系的建立,原来由国家投资,以事业管理方式建立的文献数据库被逐步推向市场。这无疑是我国文献情报事业改革的一项重大举措。从观念上看,文献数据库建设过去被认为是一种事业,需要国家投资,现在则被认为是一种产品,一种商品,需要按市场需求去生产,按市场规律去营销。为此,中国科学技术信息研究所(原中情所)成立了万方公司,国家科委西南信息中心(原重庆分所)成立了维普公司。这两个公司的成立,标志着我国文献数据库建设事业开始了一种崭新的管理与运作模式。管理体制与经营方式的变革使得这一事业以一种前所未有的方式和速度向前发展。万方、维普两公司,清华大学光盘国家研究中心(最近,清华大学又成立了中国学术期刊(光盘版)电子杂志社)以及其他一些数据库生产经营公司近年来所取得的成功,都可以说是这种管理体制变革所带来的成果。因而,笔者认为90年代是中国文献数据库建设事业市场化发展的阶段,是一个取得很大成就的发展阶段。这一阶段的开端,正是以万方和维普两个公司的成立为标志。
2 商业化经营使数据库市场逐步形成
认识观念和管理体制的变革,必然引起数据库生产和经营方式的变革。90年代以来,数据库生产单位,特别是各公司为了使产品赢得更多的用户,都采取了许多市场营销的方法和手段。例如,维普公司的产品营销工作给人留下了很深的印象。他们利用在全国各主要城市举办新闻发布会、产品演示会,参加博览会、展览会,召开学术研讨会、用户座谈会等方式,广泛宣传各种产品。采取灵活多样的营销策略,尽量满足用户的各种需求。公司生产的中文科技期刊数据库,用户可订购完整的数据库,也可订购其中16个类别的某一或某几个类别,还可提出各种特殊的要求。公司还定期走访用户,提供全面的售后服务。优良的产品,广泛的宣传,加上完善的服务,使该公司产品的用户数量达到5000多家。
清华大学光盘国家研究中心的产品营销策略也很有特色。他们采取在国内主要大中型图书情报单位设立中国学术期刊文献咨询检索站的方式,来推广其产品中国学术期刊(光盘版)(CAJ—CD)的应用工作。 检索站按其规模划分,可分为三个级别。一级检索站单位需建有计算机局域网或校园网,配置CAJ—CD6至8个专辑,全年配置光盘近百张, 有专业检索人员2人以上。二级检索站单位也需建有计算机局域网, 配置CAJ—CD3至5个专辑,全年配置光盘近50张,有专业检索人员1—2人。三级检索站单位需拥有一台以上586计算机,配置CAJ—CD1 个以上专辑,有专业检索人员1人以上。 各级检索站可从光盘中心得到一定的技术支持和其他一些优惠条件,同时也要承担一定的义务。检索站的设立使产品的生产者和使用者的利益联系到一起,有力地推进了CAJ—CD 的发行和应用,使CAJ—CD在很短的时间里在全国得到较广泛的应用。目前,在全国各地已设立了800多个检索站。 这是利用市场运作手段在短时间内使产品成功地占领市场的一个典型范例。
3 文摘型文献数据库日臻成熟
近年来,全国各系统建立的各学科文摘或索引型文献数据库数以百计,但是在全国具有较大影响的大型科技文献数据库并不多。以下几个数据库产品的发展情况,表明我国文摘型文献数据库建设正在日臻走向成熟。
中文科技期刊数据库 是维普资讯公司的拳头产品,创建于90年代初。到1998年6月30日为止,该库共收录1989年以来所有自然科学、 工程技术领域以及经济、文化、教育、图书情报等社会科学领域的中文科技期刊6069种(其中包括200余种港台核心期刊)。 已累积文献数据近279万条。具有光盘和软盘产品,每3个月更新一次,每年更新4次。 检索途径包括分类号、主题词、著者、刊名、篇名全文检索,以及一些辅助检索功能。光盘有单机版和网络版可供选择,即将推出Windows95 版检索软件。该库被广泛用于科研立项,成果查新,技术咨询以及高科技产品开发等领域。该库的一个重要特色是,对其报道的所有文献,公司均有原文收藏,可根据用户要求,快速准确地提供原文复制服务。目前,该库在我国的同类数据库建设中保持着多项第一的位置。覆盖学科领域最广,累积文献条数最多,更新时间最快,最早推向市场,最先出版光盘,同时也是在国内外拥有最多用户,社会效益和经济效益最好的数据库。
中国科技文献数据库 是在国家科委信息司的主持和资助下,由万方数据公司于1995年联合近30个国家部委和科学院系统的科技信息机构,共同开发的一个大型文摘型文献数据库。有光盘版,每年更新一次。该库1997年6月出版的97版光盘收录文献量为170万篇。共包括三张光盘,1号盘为农业、林业和基础学科,2、3号盘为工程技术各个领域。 覆盖了近6000种以科技期刊为主的文献源,收录文献的出版时间可回溯到1980年。该库是我国科技信息界权威机构联合行动的结晶,具有学科覆盖面广,收录文献时间跨度长,文摘率高等特点。可满足各信息机构、科研院所、大中企业在科学研究、技术开发、信息咨询等方面的不同信息需求。
中国科学文献数据库 是由中国科学院文献情报中心牵头,联合院内的多家单位共同研制的大型综合性的中国科技文献文摘数据库,创建于80年代中期。收录文献的学科范围涉及化学、生物、物理、光学、力学、数学、天文、地理、计算机、电子学、金属腐蚀与防腐蚀和稀土应用等基础研究领域和部分应用技术领域。收录的文献类型包括期刊论文、会议文献、图书专著、科技报告、专利文献和学位论文等。近年来,尤其注重收录中国学者在国外发表的论文。该库数据具有很高的中文文摘率,许多数据同时带有英文文摘,数据的题名和主题词多为中、英双语种著录。该库光盘为Windows版,每年更新一次。其97 版光盘报道了自1984年以来,我国广大科技人员在2000余种中、英文期刊上发表的论文和其他类型文献共54万条。其数据量是该库1996 版光盘数据量的145%。该版光盘除了具有96版光盘已有的主题、著者、机构、中图法分类、出版物名称、题内关键词等检索途径和四种快捷的代码检索方法外,还把检索点扩大到中英文文摘的每个字(词)。光盘除作为科技文献查询工具外,还可作为中英文名词互译、学术活动评价、科技动态报道,以及科研人员或科研机构学术地位横向比较的查询工具。
4 光盘版数据库产品丰富多彩
90年代以来,我国的文摘数据库建设事业呈现出蓬勃发展的趋势。其中一个很重要的特征就是数据库的品种有了很大的增加。各数据库生产单位都在原有的品种之外,开发研制新的数据库产品。例如,维普公司在成功地将中文科技期刊数据库推向市场的同时,又相继开发了计算机应用文献数据库、中国科技经济新闻数据库、全球百万进出口公司数据库等产品。万方公司在开发成功中国企业、公司及产品数据库之后,又先后开发或接收并发展了原来由中信所承建的一批数据库,这些库包括:中国科技文献数据库、中国科技论文与引文数据库、中国学术会议论文数据库、中国科学技术成果数据库、中国学位论文数据库、中国科研机构数据库、中国科技名人数据库、中国百万商务通讯数据库、中国科技信息机构数据库等。中国科学院相继推出了中国化学文献数据库、中国科学文献数据库、中国科学引文数据库、中国生物学文献数据库、中西文期刊联合目录数据库等产品。清华大学1996年推出了中国学术期刊(光盘版)电子杂志。此外,其他一些情报单位也推出许多光盘版数据库产品,如中国专利文献数据库、中国医学文献数据库等。这些数据库除以光盘形式出版之外,一些库还同时提供软盘版产品。丰富多彩的光盘版数据库产品使我国电子信息资源缺乏的状况有了很大的改观,从多方面满足了广大用户的信息需求,构成了我国信息产业发展的重要标志。
5 网络化联机检索系统发展迅速
1994年4月,中国与Internet正式联通, 其后中国相继建成了中国科学技术网(CSTNET)、中国教育科研网(CERNET)、中国公用计算机互联网(CHINANET)和中国金桥信息网(CHINAGBN)等大型计算机通讯网络。其中,前两个网络为非盈利的学术网,后两个网络为商业网。有关统计表明,目前联在这些网上的计算机数量约为60多万台。网络的快速发展,为联网数据库检索系统的发展创造了十分有利的条件。
1997年,在原国家科委的主持下,由中国科学技术信息研究所牵头,组织全国信息机构,开始建设ChinaInfo系统。ChinaInfo是以国家信息基础设施为依托,利用Internet技术提供网络化中文信息服务的全国信息系统。是一个现代化、网络化,覆盖全国的以科技信息为主体,集经济、金融、社会、文化、教育信息于一体的综合性信息系统。该项目采取国家立项,企业运作,中央为主,地方协配的建设方式。建设的目的在于利用Internet网络,向用户提供广泛的网络化的信息查询和浏览。ChinaInfo系统已于1997年8月正式开通。目前,该系统已收集建立了总容量达几十亿字的近百个数据库。其范围涉及科技、文献、经济、生活等领域,以科技信息为主,兼顾其他。该系统全中文环境运行,具有较好的交互性界面。ChinaInfo已在全国建立了20多个分中心, 系统的用户管理采取“一处注册,全网通行”的方式。网上的大部分信息免费服务。
此外,中国科学院、国防科工委、清华大学、北京大学以及其他许多单位也都利用联网的优势,通过各自的主页提供多种联机数据库检索服务。例如,中科院自1995年起,就将其所建的多种数据库送到网上,向用户提供免费查询服务。随着中国网络系统的发展,网上用户的增加,网上数据库管理系统的完善,以及网上数据安全和数据所有权问题的逐步解决,预计今后在网上提供的文献数据库(特别是全文文献数据库)的数量会越来越多。
6 全文文献数据库异军突起
1994年10月中国科学院在杭州召开了全院文献数据库专家委员会第二次年会,会议决定投入力量开始研制和建设中国科学文献全文数据库。会后院里成立了课题组,研制工作正式开始。1997年底,出版了中国科学文献全文数据库光盘样品盘。样品盘收录了38种中国出版的中、英文科技期刊(中、英文各19种)1996年全年发表的3000余篇论文。
与此同时,清华大学光盘国家研究中心开始研制中国学术期刊(光盘版)全文数据库。光盘版研制工作自1995年8月开始筹办,1996年1月CAJ—CD开始试发行,1996年12月公开发行,1997年9月起以电子刊号的方式正式发行。到1998年7月,光盘版入编期刊数量达到2700种, 其中科技类期刊1800余种,社科类期刊860余种。光盘版为月刊, 按理工(分为A、B、C三辑)、农业、医药卫生、文史哲(双月刊)、 经济政治与法律、教育与社会科学综合八个专辑出版。这些专辑共包括100 多个学科类目。每一种期刊在CAJ—CD中既保持整刊的完整性和独立性, 又以文章为单位,按学科分类进行跨专辑组合,使交叉学科的文献在不同的类目中得到反映。CAJ—CD拟收录3500 种中国学术核心期刊和专业特色期刊。(其中包括科技类期刊2200种,占我国出版的科技类期刊总数的41.5%,社科类期刊1300种,占我国出版的社科类期刊总数的33.5%)。到1998年6月,已累积出版了21期共148 辑光盘, 累计报道全文文献50余万篇。在CAJ—CD发行的同时, 光盘中心积累了所有入编期刊的电子版全文数据,建立和发展了中国学术期刊全文文献数据库。随着全文库数据的积累,该库必将在许多方面发挥其潜在的各种功能。
7 科学评价性文献数据库各具特色
美国出版的科学引文索引不仅以其收录广泛的世界最高水平的科技期刊而受到世界各国学术界的重视,而且以其具有多种科学评价功能而著称于世。为了向中国的科研管理与决策机构提供有关中国情况的相应工具,中国科学院文献情报中心自1990年起,正式开始建设中国科学引文数据库。引文数据库以文献正文与引文之间的内在联系为纽带建立起索引关系,既具有检索功能,又具有科学评价功能。通过对论文发表量和被引量的统计分析,可以定量地评价各种科学活动,为科研管理和决策提供参考依据。中国科学引文数据库以数、理、化、天、地、生、农、林、医及工程技术等领域中国出版的582种(1995年以前是315种)中、英文核心期刊作为来源期刊,收录自1989年以来这些期刊发表的全部来源文献和中国引文数据。目前,该库已积累了30余万条来源文献和100余万条中国引文数据。自1996年起,该库开始出版光盘, 每年更新一版。光盘的检索系统设有12种检索途径,4种显示、输出格式, 有字典式和命令式两种检索方式。近年来该库已为数以千计的用户提供了引文查询服务,为中科院的科技期刊评奖等工作,提供了期刊引文数据。该数据库是国家自然科学基金委员会申请青年基金科研课题指定查询的文献数据库之一。
中国科技信息研究所信息分析研究中心自90年代初开始建设的中国科技论文统计数据库,收录中国出版的1250种科技期刊。该库不仅可通过题内关键词检索科技文献,更主要的是它可通过地区、城市、学科、科研单位和高等院校、各基金资助的论文等角度,对论文的发表情况进行统计分析。通过对该库及国外有关检索工具数据的统计分析,该所每年12月通过各大新闻媒体发布中国科研人员和科研教育机构在国内外发文和引文统计数据。这一工作在全国产生了很大的影响,引起上至政府决策部门,下至各科研教学单位的高度重视。许多单位以这些数据为依据制定或调整本单位的科研教学计划。1995年以后,该库又增加了引文检索功能,使得该库的统计分析功能更为完善,库名也因之改为中国科技论文与引文分析数据库。该库光盘每年更新一次。其97版光盘收录了自1989年以来的70余万条来源文献记录和20余万条引文记录。
清华大学光盘国家研究中心建立的中国学术期刊全文文献数据库,在不到两年的时间里,已积累了50多万条来源数据,同时积累了这些来源文章包含的所有引文数据。而且,其数据量的增长速度非常快。光盘中心已充分认识到这些宝贵数据资源的潜在价值,正在着手建立中国学术期刊检索与评价数据库。1997年底和1998年7月, 先后两次召开专家会议,研讨制定评价数据库的规范标准问题。相信该评价数据库建成后,将可以从多种角度进行统计分析,满足不同部门和单位对文献计量统计数据的各种需求。
收稿日期:1998年11月11日