国外数据库的技术创新点研究,本文主要内容关键词为:技术创新论文,国外论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
信息资源在总量上的快速递增与其在分布上的无序化趋势是当前信息资源的两个重要特征。以构建信息资源数据库的形式对现有信息资源进行集中收集、开发并提供使用,是目前为止能很好地协调二者的关系,并能有效化解由此产生的对用户利用和获取信息资源的负面影响的成功方法。在国内的数据库建设向产业化推进的同时,对国外数据库以集团购买方式的引进,是近几年国内信息资源建设的一个重要特点。已引进的数据库无疑是国外数据库体系中的精品,能代表国外数据库建设的当前特点与发展趋势。信息资源建设是信息服务业发展的资源保障,也是国内信息服务也可持续发展的前提条件。数据库建设是信息资源建设的重要组成部分,研究、了解国外数据库的成功经验与技术创新特点,可以给国内数据库产业发展提供操作方向上的建议。同时,探讨与了解国外数据库的特点、发展趋势,对国内信息服务机构评价、引进、有针对性地开发利用电子信息资源具有一定的现实意义,也是本文的着眼点。
1 国外数据库建设的当前特点与发展动态
1.1 创造性地运用网络技术提供信息服务
数据库产业无疑是最能见证现代技术的发展速度的一个新兴产业。最初以光盘为载体的数据库,已逐渐过渡到以网络数据库为主,光盘数据库与网络数据库并存的局面。原来的联机数据库检索系统在经历了网络技术的彻底改造以后,基本升级为网络数据库。以互联网为信息管理与传输平台,数据库生产商一方面可以随着网络的延升将信息送达终端用户,同时,网络亦极大地提高了对不断增长的大规模数据的管理、发布能力。数据库生产商运用网络技术改造数据库的信息管理与信息服务功能的普遍努力,使当前国外的数据库呈现出以下特点:①数据库的数据容量增大直接促成了数据库规模的扩张,数据库产业化成为必然。ScienceDirect目前可在线提供的数据库集中了一个综合性的学术期刊全文数据库、若干个专题数据库、12种参考工具书及15个书目数据库。该数据库系统可供检索、浏览的信息资源涉及1200种重要的学术期刊,5900万条文摘信息、200万篇学术期刊论文。包括三大引文数据库、期刊目次库、多个专题数据库与事实数据库、会议录、专利信息数据库的ISI Web of Knowledge数据平台,目前已囊括8000余种核心期刊、200万条学术会议信息、2000余万条专利信息等,该数据平台所收录的相关信息资源在总量上有逐年递增趋势。②数据库的数据更新速度更快,网络数据库一般为每周更新,这一特点极大地保证了数据库能将最新的信息资源提供给信息用户。③数据库以网络为出版平台,能打破时间和地域的限制,为世界各地的授权终端用户提供不受时空限制的全天候服务。
1.2 信息检索与文献全文获取的一体化
原始文献通常是用户信息检索的最终目标,为实现数据库信息检索与原文获取的一体化,国外的数据库生产商普遍重视全文数据库的开发与原始文献的提供。通过强化数据库原始文献取用的便捷与即时性,提高数据库原始文献的保障能力。主要通过以下途径满足数据库的全文获取功能:①不断开发新的全文数据库。考察国外数据库产业的近期动态可以发现,全文型数据库的比例上升明显。尤其是以高品质的学术期刊为资源构成的学术期刊数据库,大多为全文数据库。具有品牌效应的数据库生产商在进行学术期刊资源的回溯建库时,基本上以全文数据库为建库模式。Elsevier2001年启动的回溯建库项目即包含了300多万篇期刊论文全文,至项目完成时,通过ScienceDirect,用户可检索的期刊论文原文将多达800万篇。②增加现有数据库中全文期刊的品种与数量。如Bell&Howell(原UMI公司)的学术期刊图书馆所收录的全文期刊由1999年的1472种上升到2002年的1700余种;EBSCO的学术期刊全文数据库1999年包含全文期刊996种,2002年其升级版Academic Search Premier收录的全文期刊已增至3467种;ElsevierScience的ScienceDirect期刊数据库经过一系列的资源重组,所覆盖的全文期刊已达1500余种,成为目前全球最大的全文期刊数据库。③通过提供原文链接,连接到出版商的电于期刊全文、相应的全文数据库、互联网上的全文文献或图书馆的纸本全文馆藏。ISI是采用这种方法提供文献全文的代表,以引文机制为特色的ISI数据库系统与世界范围内的文献出版商建立了广泛的业务合作关系,力争使该系统所收录的8000多种期刊与相应的期刊论文电子版全文建立链接,用户可通过网络订购文献全文。
1.3 数据库结构优化
重视数据库的结构的优化及其功能的完善,是目前数据库开发商共同的市场策略。国外数据库生产商为优化、提升数据库的功能主要通过两种手段。其一,改进、完善数据库原有的结构与功能,如增加互动式词表索引、提供浏览式索引、增加检索途径与定题追踪、向信息中介提供在线使用统计报告等。为此,数据库生产商必须根据需要适时对数据库的系统平台进行升级。第二种途径是围绕核心数据库,开发出针对特定学科(主题)、特定文献类型的数据库,这些数据库在结构与功能上更具个性化色彩,更贴近信息用户的检索需求。在开发个性化数据库的同时,同一数据库体系中数据库的跨库检索功能已成为数据库生产商的技术热点。根据这一态势,未来数据库群体中,某些目前为一些数据库所特有的技术机制,将成为一种共同的技术趋势。
1.4 数据库的检索功能强大
为提高数据库的检全率、检准率与检索速度,使数据库的检索系统更具灵活性,国外数据库生产商对其数据库检索系统的性能给予了更多的关注。①各数据库基本提供多种检索选择,除供初学者及一般用户使用的基本检索或简单检索界面,也包含供专业用户使用的高级检索模块,还设计了供初学者学习数据库操作方法的随机帮助系统。这种安排,照顾了不同层次用户的需要。②数据库的检索入口的设计,概括了各类文献资源的共同特征,又能贴近用户的不同检索起点。各数据库系统通常提供关键词、文献题名、文献著者等具有检索价值的检索入口。一些数据库如INSPEC提供的检索字段达40余个。③为提高检索精度,数据库系统允许用户根据需要对数据库进行多种检索条件设定:用户可以使用逻辑算符、位置算符、截词符等进行扩大或缩小检索范围的操作,允许对数据库的文档、可检字段、出版时间、文献类型等进行选择。允许用户对检索结果的显示方式与输出进行多样化的处理。在检索结果的处理上,用户可对每屏的记录数进行限制,可以选择按检索结果的相关度、出版时间、文献标题、著者、来源、语种及出版国等多种方式进行升序或降序排列,对检索结果的显示格式也提供多种选择。检索结果的输出方式的提供也体现灵活、多样的特点,用户可以直接存盘、打印检索结果,可以将检索结果用电子邮件发送至指定的计算机,也可以在线订购文献原文。
1.5 数据库的相关技术标准统一、规范
国外数据库的标准化与规范化是与其施行相对统一的技术标准密切相关的,尤其是网络数据库的生产。表现为大多数数据库采用了超文本、超媒体等信息处理技术,信息传输基本遵循Z39.50协议,采用通用型浏览器IE、Netscape,以及PDF格式文档标准阅读软件Acrobat Reader。统一的信息处理与传输标准,为用户提供了无形的检索便利。也便于不同数据库系统之间的数据交换及数据库生产商进行系统的扩展,是数据库系统稳定运行的保障。
2 国外数据库的技术创新点
为了谋求更大的生存空间、提高核心竞争力,进而取得更多的市场份额,国外数据库生产商纷纷以持续的技术创新规划,实施其发展战略。近几年国内引进的有代表性的国外数据库产品,就是了解国外数据库产业在技术创新上的动态与特点的可靠案例。通过比较、分析可以看出,国外数据库建设中的技术创新主要集中在对信息资源的集成化管理和为信息用户提供智能化、个性化的信息资源利用环境等方面。
2.1 以信息资源的整合为手段创建对学术信息资源的集成化管理系统
信息资源的分散分布和由此产生的相互隔离状况,是制约信息用户有效地利用信息资源的基本因素。将在内容上具有相关性的异构资源用适用技术与方法进行集成化的管理,使它们成为一个相互保持动态联系的有机整体,是信息资源的生产商和信息用户共同关注的问题。以保持知识体系的完整性、关联性为宗旨,对现有信息资源进行资源整合,从而为信息用户提供一个集成化的信息资源利用环境,是克服信息资源在总量上的不断增长对信息资源的有效利用带来的负面影响的可行方法。国外的一些数据库生产商在这方面率先进行了成功的尝试。经过资源整合的数据库系统,成为一个包含若干具有内在关联的数据库的资源群体。其中,ISI便是一个经典案例。
ISI在原有的引文机制的基础上,创造性地运用WWW的链接技术,以ISI体系内的不同数据库为核心进行以数据库的跨库检索为操作目标的资源整合。在此基础上谋求更广泛的资源背景下的信息资源的开放式整合。在ISI Web of Knowledge为信息用户精心构筑的学术信息资源门户中,包含了以下几类信息资源:①Web of Science体系中的三大引文数据库(SCIExpanded,SSCI,A&HCI)、Web Of Science Proceedings;②其他数据库生产商的数据库产品及学术出版机构的学术资源如Derwent Innovations Index、BIOSIS Previews、Journal Citation Reports on the Web等数据资源;③二次文献数据库与事实数据库;④ISI集体用户的本地资源,包括用户的本地化原始文献与相关的书目信息资源;⑤JCR Web等科学计量学工具的链接。ISI的信息资源整合方案中,突出了原始文献、二次文献、事实及数据资源等信息资源的内在知识联系,通过在所有资源间建立双向链接,使具有知识关联性的信息资源单元共同进入研究人员的检索视野。
ISI的资源整合方案在国外的数据库生产商中颇具代表性。它成功地解决了基于Web的数据库无缝链接与跨库检索问题,通过在不同类型的多种信息源之间建立相互链接,整体上提高了数据库对分布式信息源的管理能力。由此形成一个开放式的学科学术信息门户,在保证知识体系的相互关联性、完整性的前提下,使用户可以在一个相互联系的知识体系中,进行更有效率的检索,通过一次性检索操作即可获取包括原始文献、二次文献、事实型信息在内的全部相关信息。进行资源整合后的数据库检索体系更具易用性,也更加人性化。
2.2 智能化、个性化的用户服务策略
利用现代通讯技术与网络技术,国外数据库生产商致力于具有智能化、个性化的信息服务系统的开发。新一代的智能化、个性化代理服务系统可依照用户的不同需要进行定制和细分。具有代表性的有最新目次提供服务、文献被引用情况的追踪服务等,这类服务按需定制,以通用性的网络传输手段自动传送,并实现与文献原文的实时链接。近年来,以信息推送和信息拉取服务成为个性化、智能化信息服务的重要手段。依个人兴趣爱好在数据库提供的学科主题范围内进行自主选择的网页定制服务,用户可以根据需要选择特定的学科、主题定制网页,选择特定的出版物,建立自己最喜欢阅读的期刊列表,提供网页定制服务的系统平台可自动识别读者。个性化、智能化的信息服务还包括为作为信息服务中介的集体用户如图书馆设计用户定制界面,添加机构标识、提供用户指南链接,为图书馆提供所收期刊的机读目录数据、加载本地资源的馆藏数据等。
2.3 实时、动态的数据库在线管理系统
提供对数据库的在线管理是数据库生产商利用网络技术的便利的直接产物。数据库的在线管理主要通过提供使用统计报告、事项通知及在线服务热线等方式进行。其中,数据库在线使用报告是主要内容,该服务包括允许系统管理人员利用全文显示、打印及下载等选项方式定制,以期刊或数据库为基本单元制作资源使用报表,控制用户的帐号及密码。图书馆系统管理人员也可将使用报表细分为使用记录统计报表、数据库使用记录报表、期刊使用统计报表及IP地址使用报表等。数据库提供的在线管理功能是图书馆电子资源建设的重要参考依据,图书馆通过使用报表进行馆藏电子信息资源的评价与分析。还可以从收集来的数据库使用统计信息中了解信息用户的需求倾向,对使用频率低的数据库加强用户培训工作。数据库在线使用统计数据也是数据库开发商了解、监测数据库产品的使用和服务状况的可靠手段。数据库的事项通知包括数据库检索平台升级与最近更新资源通报,以便图书馆等集体用户及时了解数据库的新功能、新资源。数据库提供的在线服务热线则可以及时解决图书馆在利用数据库的过程中出现的问题。
3 借鉴与思考
在国内的信息基础设施的建设取得数量与规模的共同发展之后,我国信息化建设的重心将转移到信息服务业上来,这一趋势是信息产业发展规律的必然要求。由这一要求引发的对信息产业结构的深层次调整,使信息资源的建设成为今后我国信息产业发展的战略重点。因此,围绕提高优质的中文网络信息资源在网络资源中的总体比例,是当前及今后较长的时期内信息资源建设的重心。随着我国以加入世界贸易组织为标志的国际化步伐的提速,信息服务业的竞争空间将呈全球化。
国外信息服务机构以输出数据库为主要手段向国内信息服务业的渗透,虽然只是其国际化战略的一部分,其已经显示出的竞争实力是有目共睹的。国内的数据库建设由于起步相对较晚,在相关的政策建设、市场机制建设、数据库的技术标准建设等方面,与有着丰富的市场经验和技术背景的国外数据库产业相比,差距是极为明显的。为使数据库建设领先于国家科技创新体系的建设与经济发展的需要,国内的数据库建设应以国外优秀的数据库生产商的产品为参照。在开发和引进相关技术时,应以能否满足对信息资源进行系统集成的管理,对所有相关资源进行符合信息用户需要的资源整合为导向。数据库生产商应致力于运用先进的信息技术对现有系统进行功能改造,提升数据库的资源管理功能与检索功能,吸收国外数据库在用户服务策略上的先进做法,强化数据库的智能化、个性化服务能力。同时,在数据库产业的宏观管理方面,应在避免资源的重复建设和推行统一、规范的技术标准上更有建树。