中日数据库产业的比较,本文主要内容关键词为:中日论文,数据库论文,产业论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
日本的数据库产业起步比我国的数据库产业早,数据库的数量、规模、质量,数据库服务都胜过我国。通过与日本数据库产业的比较,找出我国存在的差距,学习人家的经验,吸取人家的教训,有利于我国数据库产业的发展。
1 日本的数据库产业
日本的数据库产业起步较早,发展速度较快。日本早在1969年的科学技术会议上就提出了发展国家信息科技(NIST)的构想。70年代开始提供数据库服务,1970年经济新闻社开始销售财务及股票的数据磁带,1971年电电公社(NTT)开始生产多重联机存取的“DEMOS-E ”数据,1972 年日本开始利用科技信息中心(JICST )的联机检索批次服务,1974年市场信息中心开始提供“QUICK/VIDEO1”服务,1979年开始DDX数字数据交换网络服务。80年代出现联机服务,建立数据库振兴中心(DPC),修订版权法并补充了数据库版权条款。从80年代末至今, 在短短的10年间市场规模增加了1.5倍,数据库增长了5.7倍。提供给海外用户的数据库数目增加至占国产数据库数目的30%。日本人使用国产数据库占了国内总数据库的90%。数据库市场销售额为数据库强国——美国的20%。从事数据库行业的机构有100多家。
1.1 数据库产业的市场规模
日本数据库产业的年产值超2000亿日元,由联机服务年产值和脱机服务年产值两部分构成。统计数字显示联机服务的构成比例、年销售额都高于脱机服务。脱机服务要依靠只读光盘(CD-ROM)、磁带来提供。用户购买这些信息产品基本上是一次性的,即使需要更新,数目也不可能大量增加。在经济不景气的情况下,脱机服务往往还成为削减经费的对象。
1.2 数据库的构成及变化
日本的数据库由国外数据库和国产数据库两部分构成。国外数据库所占比例大,约为总量的2/3,国产数据库仅占1/3。尽管在总量上海外数据库占优势,但在增长率方面是国产数据库占优势。1993年日本国产数据库为1007个,比1992年增加了8%,海外数据库的增长率为5.7%。从数据库的信息内容看,数据库的构成情况可见下表:
日本的数据库类别
商业一般自然科
社会人
其它
总计
学技术
文科学
数量
1106 871 845 97 61 2980
比重 37.1%29.2%28.4%3.3% 2% 100%
由表中可以看出商业方面的数据库数量最多,其次为自然科学领域。目前,一般领域的数据库有增加的趋势。
1.3 数据库的利用情况
日本国内利用数据库的用户可分为企业用户和个人用户。据数据库振兴中心(DPC)1994年所做的“数据库实态调查(用户篇)”统计,70%左右的企业正在利用数据库,利用数据库所花费的金额大企业比中小企业多10倍以上。利用数据库的企业内部主要是研究部门、专利部门、调查部门在利用数据库,营业部门、计划部门也利用数据库,但其利用的广度、深度不及前几个部门。个人对数据库的利用率较低,仅有2.9%,据数据库振兴中心1994年所做的“个人、家庭利用数据库状况调查”结果显示:个人对数据库的利用率在提高,60%的人有利用数据库的经验,但多数人对数据库利用的时间很短,平均一周不足30分钟。个人用户利用数据库所支付的费用很少。
由于日本在经济、技术方面有一定的优势,海外用户对于日本的信息需求逐步增加。日本数据库产业顺应潮流发展,向海外提供服务的数据库数目也不断增加。1993年度共有353种, 其中使用日语的数据库有225种,使用英语的数据库有50种,同时使用这两种语言的也有50种。
就企业用户而言,其利用最多的数据库是:JIGST 的科学技术文档,但不是利用金额最多的数据库,利用金额最多是日本科技信息中心的联机检索系统(JOIS)。个人用户经常使用的是记事信息、书籍信息、企业信息等数据库。
用户在利用国产数据库时,侧重于一般新闻及企业信息;利用海外编制的数据库时,侧重于专利及医学信息。用户利用数据库的目的多是出于工作需要而非基于兴趣等私人原因。用户利用数据库的方法有依靠检索专家帮助完成检索的,但为数不多,绝大部分用户是自行操作找出自己所需的信息。
日本数据库存在的问题主要是缺乏与个人生活密切相关的信息,如购物、座位预约、旅游地点等。私人对数据库利用比率不高。利用数据库主要靠用户自己,服务不完善。
2 我国数据库产业的概况
我国的数据库建设始于70年代中期。1975年北京文献服务处引进美国政府研究报告CRA数据库进行试验性服务。80 年代该处又引进国外机读文献的磁带进行数据库小规模批式服务。“七五”期间我国建立了国家经济信息系统等12个电子化信息系统。据国家计委和国家科委1995年统计,我国共有1038个具有一定容量、能对外服务、可供社会各界利用的数据库。
2.1 数据库服务产业的市场规模
我国数据库服务主要有联机网络服务和光盘数据服务两种方式。由于我国数据库中的信息绝大部分为二次信息,比例占70%;数据库的商业化率低,大多数据库仅供本部门用户使用,较少向社会各界提供服务。“谁使用信息谁付费用”的观念尚未在用户中形成,加之我国的信息用户多为消费水平较低的科研、教学人员,因此我国数据库产业的市场销售规模较小,年产值较低,估计不足一亿元人民币。
2.2 数据库的构成及变化
我国的数据库是通过开发引进国外数据库资源、建立汉字数据库和信息管理系统两种方式,在学习、对比、吸收国外先进技术的基础上发展起来的。我国现有数据库中,41%是由国务院各部门建的,59%是由地方建的;记录用文种中文占70%,英文为7%,多文种为14%; 数据库的信息多为二次信息(70%),一次信息仅占30%。数据库的内容覆盖了基础学科、农林医、工程技术、经济、社会科学。数据库的内容正从初期的以科技为主转向以经济和社会领域为主,据《中国数据库大全》的统计资料显示,经济与社会方面总数据库个数为572个,占55.11%,科学技术方面总数据库为466个,占44.89%。
2.3 数据库的利用情况
我国的数据库用户有单位用户和个人用户两种类型。单位用户数量较多,其中多为教学科研单位,企业单位极少。个人利用数据库的机会较少。
我国的数据库质量不稳定,记录用文字多为中文(70%)。质量和语言文字障碍限制了海外用户对我国数据库的需求,也限制了我国向海外提供服务。
我国利用率较高的数据库主要有:《中文科技期刊数据库》(1983—)、《中国科学引文索引》(1991—)《中国专利文摘数据库》、《中国经济新闻库》、《中国学术期刊》(光盘版)等11种数据库。
我国的数据库用户多是因工作需要而利用数据库,或因评定职称需撰写论文而利用数据库,因个人兴趣而利用数据库的极少。我国用户利用的信息多为自然科学、工程技术、社会科学等方面的内容,其次为经济信息。
目前,我国用户可通过国际联机检索,也可通过在进口数据库产品基础上开展的定题检索和回溯检索、国产数据库联机检索等方式利用数据库。用户既可依靠专业人员帮助获取信息,也可依靠自己获取信息。用户在利用国内数据库时,往往是依靠自己进行检索。
总的来说,我国的数据库可用性差、利用率低,其原因是多方面的,主要有以下几个方面:(1)数据库建设缺乏连续性, 影响了数据库的声誉,影响了信息用户利用数据库的热情。(2 )数据库没有实现商品化。许多数据库研建单位靠事业经费建库,建库目的不是为了走向市场,服务社会,而只是为了本系统、本部门的用户。(3 )数据库建设投入少,影响数据库质量。(4)商情数据库少。 世界上经济较发达的国家在发展数据库产业时,很重视商情数据库的建设。我国的商情数据库规模少、种类少,联网率低,远远不能满足社会的需求。
2.4 我国数据库产业存在的问题
我国的数据库缺少商情信息,为数不多的商情数据库建库规模小,不能满足社会需求。数据库的商品化程度低,尚未全面走向社会。标准化、法制化水平较低,各数据库的建设没有使用统一标准,所建的数据库大部分不能并网使用。尚未单独制订保护数据库的法规,仍把数据库当作汇编作品保护。专业人员素质偏低,服务手段落后。用户较少,尤其是海外用户。年产值偏低。
3 中日数据库产业的异同
通过上述的比较分析,我们可以清楚地看到中日两国在数据库的利用目的、方法上有一些共同点,在信息内容上也有一些共同点,两国都缺乏与个人生活密切相关的信息。我们也清楚地看到我国数据库产业与日本的相比,有许多不足。
4 我国数据库产业的发展方向
我国的数据库产业要步入快速发展期,赶上世界数据库产业发展潮流,必须根据数据库的特点,借鉴国外先进经验,结合我国数据库建设的条件及存在的问题,选择正确的发展方向。
第一,加速数据库产业的标准化、法制化建设。加快制订有关数据库建设的国家标准、统一格式,努力向国际标准靠拢,建立功能齐全且便于联网、交互操作界面良好的数据库。加快制订有关数据库保护的法规,维护数据库所有者的知识产权,激发数据库所有者及研建者的创造热情,促进我国数据库产业快速、持续、高质量发展。
第二,开发国家级综合性大型数据库,扩大覆盖面。数据库要有检索的权威性,数据库的量和应涉及的范围一定要多而全。目前,日本和美国的数据库,数据量超过百万篇的有近千种。数据库向巨型化发展是当今世界上数据库发展的趋势,我们应顺应潮流。
第三,加快商情数据库的建设与开发。我国正在加快发展社会主义市场经济,经济建设需要大量有价值的诸如金融、保险、市场等商务信息。重视并加快商情数据库的建设开发,一方面可满足社会需求,另一方面可为数据库产业发展积累经验和资本。
第四,加快产业化、商品化进程。当今,一些发达国家按实物商品的生产、流通模式生产、销售数据库,实行数据有偿服务,已取得喜人的成果。数据库的规模和产值极为可观。我们应学习人家的经验,结合自己的特点,加快我国数据库产业的产业化、商品化进程。
[收稿时间] 1999—01—10