我国数据库评价的研究现状与发展趋势_用户研究论文

我国数据库评价研究现状与发展趋势,本文主要内容关键词为:发展趋势论文,现状论文,评价论文,我国论文,数据库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

互联网和电脑的迅猛发展,催生出种类繁多的数据库,但其质量参差不齐。如何从大量的数据库中筛选出适合用户需要的数据库显得尤为重要,因为对不同的数据库进行科学的评价不仅可以有效地为数据库购买者和使用者提供有价值的参考信息,而且也可以为数据库的采购提供必要的依据。相比于国外,数据库在我国开始大量应用的时间较晚,因此关于数据库评价的研究我国也相对晚于国外。近年来,数据库的数量和种类增多,因此对数据库评价的研究也日益成为研究人员关注的问题。笔者于2013年4月9日在CNKI的中国学术文献网络出版总库(http://epub.cnki.net/grid2008/index/ZKCALD.htm)以主题“数据库”和“评价”为搜索条件,共搜索到31686篇文章。

1 关于数据库评价研究的学科分布和发表年限的文献计量分析

1.1 论文的学科分布

从论文的学科分布上看,有关数据库评价的文章涵盖了人文社会科学和自然科学领域,其中,基础科学方面有2 911篇;工程科技方面有6 360篇;农业科技方面有2 021篇;医药卫生科技方面有11 474篇;哲学与人文科学方面有232篇;社会科学方面有1 393篇;信息科技方面有8 252篇;经济与管理科学方面有2 617篇。

因为有些文献所属学科有交叉,也就是说,一些文献既属于这个学科,又属于另外一个学科。因此,如按学科分布把文献相加,其和略大于检索出的文献量(31686篇)。总体来看,数据库评价的文章主要分布在医药卫生科技、信息科技和工程科技这三大领域。医药卫生科技和工程科技由于其众多的学科分支而形成了庞大的学科数据库,因此关于数据库评价的研究在整个学科研究中所占的比例也较大。数据库是信息科技的研究领域之一,有关数据库评价的研究自然也成为信息科技研究的重要组成部分。

1.2 论文的发表时间和发表量

从搜索出的结果来看,数据库评价方面的文章数量逐年增多,并呈现出快速增长的趋势,如图1所示(由于2013年的论文数量尚不全面故不再单独列出)。显然,以2012年的文章数量居多(5 214篇)。这说明随着数据库在社会的广泛应用,对于数据库的评价也成为研究人员日益关注的课题。

图1 数据库评价论文数量的时间变动图

2 数据库评价研究的现状

一个数据库的良好运行与多种主客观条件密切相关,因此,数据库的评价也涉及多方面的因素。本文拟从数据库评价主体、评价对象、评价指标和评价方法四个方面分别进行阐述。

2.1 数据库评价主体研究

数据库评价主体是指对数据库进行评价的个人或者机构群体。我国数据库评价主体主要包括:(1)图书馆工作者,包括高校图书馆和各级公共图书馆的工作人员。他们对于数据库的评价主要考虑数据库资源是否与本馆的馆藏互为补充或者相一致,数据库是否符合图书馆读者需求,数据库的使用效益如何,也就是说,他们主要是从数据库的实际应用方面来进行研究的。(2)数据库评价的专业研究者,包括高校信息管理等相关专业的研究人员(如武汉大学信息管理学院的研究者、北京大学信息管理系的研究者)和专门的科研院所研究者(如中国科学技术信息研究所)。对于数据库的专业研究者而言,数据库评价是他们的专业研究方向之一。他们大多数运用数学方法进行计算,从理论方面进行探讨,因此对于数据库的评价更为理论化和系统化,并形成了各自独有的评价体系。(3)其他学科的科研人员,如经济学的研究者和计算机相关专业的研究人员。出于专业数据库使用及购买的需要,他们以研究专业数据库为主,但由于其评价具有针对性,因此对于专业领域的数据库使用者和购买者也具有一定的指导意义。对于不同数据库评价研究主体的情况如表1所示。

总体来看,我国对于数据库的评价还是以个别的研究者为主,尚未形成由单位机构统一组织来对数据库进行评价的发展局面,而由数据库开发商等商业机构主导的数据库评价更是少之又少。数据库评价集中于某些专家的评价,一方面可以使得数据库评价有着良好的理论基础和一定的实践基础;另一方面却又可能导致数据库评价更加集中于少数几个权威的专家学者身上,而其评价的结果也难免带有个人的主观色彩。数据库的购买者则可能会去采购所谓的“权威数据库”而忽略了他们所服务的用户的实际需求,这在一定程度上会造成某些数据库开发商对于数据库市场的垄断,也会造成数据库的使用效果离用户的需求有一定的距离。

2.2 数据库评价对象研究

数据库评价对象可以是一个整体的数据库,也可以是数据库的某个方面。不同的研究人员因其研究的侧重点不同,评价的对象也有所不同。数据库类型可分为光盘数据库和网络数据库。光盘数据库在我国的应用早于网络数据库,因此早期数据库评价研究对象主要是光盘数据库,例如郭依群[7]于1997年从文献型光盘一般评价标准、光盘的数据组织形式与检索功能等方面出发提出了光盘数据库的评价标准,并分析了书目型、全文型和多媒体光盘的专用评价标准。但是,光盘数据库有更新速度慢等缺点。网络数据库则因其更新速度快和内容丰富等优点而得到了广泛应用,现阶段我国的数据库评价对象以网络数据库为主。总体来看,数据库评价的对象可分为:(1)对某个数据库类型整体的研究,如全文型数据库、文摘型数据库、事实型数据库等。(2)针对数据库某个方面的研究,如数据库内容、检索平台等。(3)对某个具体的数据库的研究,如SpringerLink数据库、EBSCO数据库等。

2.2.1 类型数据库研究

对于类型数据库的研究,目前研究较多的是电子全文数据库,例如期刊数据库和特色数据库等,如表2所示。数据库的类型不同,评价的标准也会有差异。

2.2.2 数据库单个方面的研究

针对数据库单个方面的研究,目前研究较多的评价对象是数据库检索功能和数据库的内容信息,其他的评价对象还包括数据库的采集和数据库的服务效益(如表3所示)。数据库评价的方面不同,评价的具体内容也会有所差异。

2.2.3 具体数据库的研究

关于具体数据库的研究,目前我国数据库评价研究对象包括国外数据库(如封星球[19]对EI Compendex Web数据库的研究和尹源[20]对ScienceDirect数据库的研究)和本国数据库(如王凌[21]对中国生物医学文献数据库网络版、中文生物医学期刊数据库、中国期刊全文数据库三个数据库检索功能的比较研究)。但是从整体来看,我国研究人员所研究的国外数据库明显地多于国内数据库,这可能与我国数据库数量相对较少,发展属于跟踪模仿式,而国外数据库结构与功能相对完善有一定的联系。一些具体的数据库评价举例如表4所示。

2.3 数据库评价指标研究

从检索到的文献来看,数据库评价的研究内容主要涉及数据库资源内容、用户满意度和使用效益等方面,例如张李义[27]对于高校图书馆商业数据库评价指标体系的研究,提出了包括数据库内容(数据库学科特色、收录内容的权威性、内容更新频率、收录内容的时间跨度、相同类型数据库的内容重复情况等)、检索系统功能(检索系统提供的功能、检索技术、检索结果处理、用户服务、查准率与查全率等)、使用情况(包括检索次数、登录次数、全文下载数量等)、数据库的性能价格比(包括数据库成本和数据库资源的性能)、数据库服务(包括数据传递方式和访问方式、非法下载控制方式等)的评价指标体系。李明伍和吕先竞[28]探讨了特色数据库系统建设评价指标,提出从数据资源、服务平台、著录标引、数据库系统平台、基础设施、推广应用6个方面进行评价,并下分二级指标,以考察特色数据库系统的建设情况。可以看出,虽然以上两个指标体系包含的内容比较全面,但是它们还是以定性评价为主,对于单个指标具体操作细节和各方面的权重尚未明确表示。赵静娟、郑怀国和谭翠萍[29]提出全文电子期刊数据库的评价指标体系应该包括数据质量、服务平台性能、价值与成本核算、数据库使用情况、长期使用能力、数据库的服务能力,并据此细化为相应的二级和三级指标,赋予每个指标相应的权重,用加权评分法进行计算从而得出评价的量化结果。

张建和芦金石[30]认为电子期刊数据库的评价须依据科学性、系统性、独立性、可获得性、可比性、代表性原则,他们从用户使用数据库的流程和数据库采购机构对数据库绩效的评价方面出发,将电子期刊数据库评价指标体系划分成5个一级指标和30个二级指标的结构。这样划分较为全面详细地概括了数据库评价的具体内容,但也有其不足之处:该体系的划分是针对整体的电子期刊数据库而提出的,因为不同类型的数据库评价指标应该有所不同,因此它对于其他类型的数据库就未必合适;此指标体系只是给出了详细的评价标准却并没有给出可以参考的一级指标和二级指标的权重分配和计算方法。该数据库评价体系也并没有进行各指标之间相关性的研究以及实际的验证,所以缺乏有力的实践证明。其他的数据库评价指标举例如表5所示。

从检索到的文献来看,数据库的评价研究主要涉及:(1)数据库的内容,如数据库的学科分布、数据库收录内容的权威性和实用性、数据库内容更新等。(2)数据库的检索功能,如数据库的基本检索和高级检索功能、可检索的字段、检索词的限定情况、查全率和查准率等。(3)数据库的结果处理,包括数据库下载方式、传递方式、下载文档处理等。(4)数据库的使用效益,包括数据库的使用成本、检索成本、下载成本、预期收益等。尽管数据库评价指标种类繁多,呈现出一派“欣欣向荣”的景象,但是,也存在着值得我们注意的问题,比如总体来说,目前我国数据库评价指标体系还不十分成熟,主要是集中于理论研究,实证研究相对缺乏;数据库评价的定性指标过多,定量指标较少,评价指标也存在着过于简单而无法反映数据库实际情况或者是过于复杂而使得指标不易获取的问题。再者,对于定性和定量指标相结合的评价指标体系,数据库内容、检索功能等评价的各个指标的权重,研究人员也并未达成一致意见,因此,不同的研究者对同一数据库的评价可能也会产生不同的评价结果。

2.4 数据库评价方法研究

数据库评价研究可分为定性评价研究和定量评价研究。我国数据库评价早期以定性研究为主,此后逐渐转向定量研究,现在流行采用定性研究和定量研究相结合的方法。数据库的常用评价方法有层次分析法、模糊评价法、主成分分析法、专家估测法等。比如,李凯扬和贾玉萍[39]通过研究高校图书馆期刊全文数据库,运用层次分析法建立了多层指标评价体系,它由三层递阶层次结构组成:数据库内容(子指标为数据库的全面性、权威性、时效性、完整性和稳定性)、检索系统(子指标为系统功能的易用性、检索结果的全面性、结果处理的多样性和系统使用中的交互性)、数据商服务(子指标为数据访问方式、访问控制方式、数据库使用方式)和数据库成本(子指标包括订购价格和使用维护成本),并利用模糊评价法进行计算,得出最终的数据库评价结果。该评价结合了层次分析法和模糊评价法的优点,建立了完整的评价指标体系,对这两种方法在数据库评价中的运用提供了借鉴意义。当然,这两种方法也有其不足之处:研究者从不同的角度和不同的研究者运用层次分析法和模糊评价法对同一数据库划分的层次体系和计算结果就未必相同。不少数据库评价研究人员对此也提出了自己的看法,如赵伟、张秀华和张晓青[40]认为运用层次分析法会涉及太多的主观因素和相对困难,针对上述缺点,他们提出了一种改进的层次分析法,即由专家给出悲观值、一般值和乐观值,运用公式权重计算单层指标,确定其相对于总指标的相对权重。

数据库评价方法的应用还体现在数据库的评价模型上。依据数据库评价的指标体系,运用数据库评价的科学方法,通过合理分配各个指标的权重,就能够得到数据库评价的具体模型。对于评价模型,有代表性的是汪媛和赖茂生[41]关于高校图书馆引进网络版全文数据库的综合评价模型。该模型对于此数据库的综合评价分为采购前的预购评价和使用中的续订评价两个阶段进行,其中预购评价以数据库的内容、检索系统及功能、数据库商服务、存档、价格为一级评价指标,下分多个二级指标,运用层次分析法建立综合评价模型,通过构造判断矩阵和权重分配,从而计算出评价结果。郑贵宇、刘芳和张小英[42]则探讨了特色数据库质量模糊综合评价模型,运用模糊综合评价法,从数据资源、数据组织、检索系统、服务功能、使用情况来构建特色数据库质量评价指标体系,通过采用专家估测法测定各指标的相对权重,最终建立了特色数据库的评价模型。

总体来看,我国数据库评价模型的构建主要有以下几个步骤:根据不同数据库的使用和其他情况,确定数据库评价的原则;确定数据库评价的指标体系,一般首先构建一级评价指标,其次再构建二级指标,形成完善的指标体系;根据专家意见或其他权威使用者的看法,计算出各个指标的权重值;依据一定的理论构建数学模型,由此形成数据库评价模型。从目前的情况来看,我国数据库评价模型还是以借鉴国外的评价模型为主,学者对于评价模型的自主研究较少。尽管在构建评价体系和计算评价指标权重时,他们考虑了不同数据库的实际情况,但在模型构建过程中设计的主观因素太多,由于不同的评价人员有着不同的评价标准,因此对于同一个数据库也会有差异较大的评价模型,相反,不同的数据库也可能会有相似的评价模型,所以,在对于某数据库的评价上,这种情形在一定程度上会造成判断混乱。

3 数据库评价研究的发展趋势

数据库的评价不同于网络资源的评价,二者的关系应该是网络资源的评价包含数据库的评价,因此网络资源评价对于数据库的评价具有宏观上的指导意义,但也要避免照搬照抄,应该根据数据库情况的不同来进行具体的评价分析。从上面的分析可以看出,我国数据库评价研究已经取得了一定的成果,但也存在一些问题有待解决。随着数据库在各个学科领域的广泛应用,数据库评价研究也必将会不断完善和走向成熟,取得更多的研究成果。目前来看,数据库评价研究的努力方向应是:

3.1 评价主体多元化

数据库的评价不能局限于某些专家学者的评价,而是应该向多元化的方向发展,根据数据库的目标用户来进行全方位的评价,使其具有实际可操作性。以高校为例,高校的数据库使用者有本专科生、教师,也有一定数量的硕博士生,对于本专科生而言,他们对数据库的评价可能就会和后两者对于数据库的评价有所不同,因此仅限于研究人员的专家评价就具有明显的局限性。再者,由于科研人员的研究方向有别,对于数据库的评价就会有所差异。因此,数据库开发商可以组织相应的数据库研究者和目标用户来对已开发或预开发数据库进行理论和实践上的探讨,从而找出数据库的不足之处以进一步适应用户需求;数据库的采购者可在正式采购数据库之前,对特定的使用人群使用试用的数据库情况进行调查研究,以确定合适的数据库,减少订购的盲目性;数据库的专业评价者应采用定性和定量相结合的方法,吸纳各方的评价意见来对数据库进行科学的评价;数据库的使用者也要积极从多个方面对数据库进行评价,以帮助数据库开发商确立合理的数据库改进方案,以帮助采购者确定恰当的采购方案。

3.2 评价内容多维化

从广义上来讲,数据库的所有方面都可以是数据库评价的对象。数据库分为多种类型,因此数据库评价也应讲求全面性,应该评价数据库的所有类型。当然,可以进行数据库的综合评价。不过,这正如大学评价类似,目前流行对某一学科进行学科评估,数据库评估也可采用某一学科或某一类别排名。比如,某一数据库法律期刊较多,被SSCI或CSSCI收录多,覆盖面广,就可获得较高的排名或者得分,这样岂不更好?此外,数据库运行与多个方面密切相连,因此,数据库评价也应从数据库采购、数据库使用和用户反馈方面进行多维度、立体的评价,而不是局限于数据库的内容和检索功能等方面。还需要指出的是,数据库评价人员要国内和国外数据库评价兼顾,随着国内数据库数量的增多和应用的广泛,评价人员也要多关注国内数据库,以推动我国数据库行业的健康发展。

3.3 评价指标具体化

要进一步完善数据库评价的指标体系。数据库的评价指标不应过于繁琐或者过于简单,而是要根据数据库的具体情况来选择合适的评价方法,并确定主要指标和次要指标。现阶段我国对于数据库的评价大部分是从对数据库内容、检索系统功能、用户的操作使用、数据库界面设计、用户个性化服务、结果处理和经济效益方面来进行的,这样既强调了数据库本身的质量状况,又考虑了数据库使用者和购买者的使用效果。但是,数据库的种类繁多,其服务的对象和侧重点也有所不同,运用近乎统一的评价指标去衡量某个具体的数据库未必合适。在不同的运作情形下,数据库评价的各个指标所占的权重有很大差异,数据库的评价应该视具体环境而定。因此在数据库评价方面,各学科的研究者对于本学科数据库的研究应该从理论上达成一致,并针对学科的特殊性和用户需求确定基本的评价标准,探索新形势下的数据库评价指标体系。此外,数据库评价也要根据数据库的自身定位和功用来进行评价,比如引文数据库的评价。不过,需要特别注意的是,数据库评价的目的归根到底是满足用户获取信息或知识的需求,因此,用户的满意度应是评价数据库的非常重要的指标。数据库评价者可以和用户合作,或发放调查问卷,或电话访问,或进行走访调查,根据用户的情况来判断数据库的实际使用状态,以便为数据库开发者和购买者提供必要的参考。

3.4 评价方法综合化

对于数据库的评价不能局限于某一种或几种评价方法,应该是多种方法综合运用才能对数据库进行比较全面的评价。当然,数据库评价也可以借鉴其他的评价方法,比如期刊评价中的IF和SJR评价因子[43],以寻找适合于数据库的评价因子。再者,数据库评价涉及多个具体的环节,因此也会有众多的数据库评价方法和模型。数据库评价者可以借鉴期刊评价的方法[44][45],结合数据库的具体情况建立适合于不同数据库的评价模型,探索适合于我国数据库评价的新路子。

标签:;  ;  ;  ;  

我国数据库评价的研究现状与发展趋势_用户研究论文
下载Doc文档

猜你喜欢