数字馆藏评价指标的获取方法_系统评价论文

论数字馆藏评价指标的获取方法，本文主要内容关键词为：评价指标论文,数字论文,方法论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

〔分类号〕G253

随着计算机和网络技术的迅猛发展及馆藏数字资源的急剧增加，数字馆藏在为用户提供更加便捷、准确的信息服务的同时，也给图书馆如何选择数字资源，如何建设和评价数字馆藏等问题带来了困扰。从相关文献看，人们对网络信息资源评价研究得多，对数字馆藏研究得少。从内容看，对评价指标体系与评价方法研究得多，而对评价应用研究得少。从评价指标体系看，对定性分析指标研究得多，对定量评价指标研究得少。为了加强数字馆藏评价的应用研究，本文将重点探讨评价指标的可获得性问题。

1　数字馆藏评价的含义与内容

数字资源或网络信息资源的评价主要是对资源内容质量的评价，其评价标准一般包括范围、内容、用户对象、图形和多媒体设计、易用性、价格等[1]。而数字馆藏是经过选择和组织起来的附有元数据描述和一个以上访问界面的数字对象集[2]，或称为数字资源的集。当然，这种集合不是简单的堆加，而是相互联系的集合，馆藏评价就是对图书馆的信息资源体系状况、功能及其发挥的作用进行检测和评估[3]。由此看来，数字资源评价与数字馆藏评价既有联系，又有区别。数字资源的评价是数字馆藏评价的主要内容，数字馆藏评价包含数字资源的评价，两者不能等同。不过，当馆藏中仅有一种数字资源时，对数字资源的评价也就是对数字馆藏的评价，这只是一种特例。

事实上，数字资源评价只能涵盖数字馆藏评价的一部分。除此之外，对数字馆藏的评价还应包括数字馆藏的内容、结构、存取能力、保藏功能等方面的评价。因为数字馆藏的使用不可能脱离对资源的内容选择、存储和网络技术的支持等。

概括地说，数字馆藏评价就是在网络环境下，对图书馆提供给用户的具有一定保藏功能和使用价值的数字信息资源及其服务的评价。因此，数字馆藏的评价离不开其运行的网络技术环境和为用户提供服务的效果。更准确地说，数字馆藏的评价包括对资源购买前的内容和检索功能评价；购买后的使用和服务绩效评价；数字馆藏各个元素之间及其与传统馆藏资源之间结构合理性的评价；数字馆藏的系统性和连续性评价；数字馆藏存取能力和保藏功能的评价等。本文在论述数字馆藏评价指标的获取时自然也包括这些重要指标。

2 数字馆藏评价指标的分类

国外对数字馆藏评价的相关研究开始得较早，建立起的评价指标体系也较多。其中影响较大、较全面、操作性较强的研究项目有：IS02789的Measuring the use of electronic library services[4]、The European Commission资助的欧洲图书馆绩效评价和质量管理系统项目EQUINOX[5]、美国研究图书馆学会统计和测量项目(ARL Statistics and Measurement Program)的一个子项目：电子资源计量项目(The ARL E-Metrics Project)中的电子资源使用评价(Measures for Electronic Use)[6]等。这些项目的评价指标多与电子资源的使用和服务绩效有关，而且定量指标较多。

这三项研究中关于数字馆藏使用和服务的评价指标比较详细、具体，量的特征明显，可获取性较强。由于数字馆藏是个体数字资源的集合，因此，当这个集合的元素为1时，其评价主要是对资源个体内容的评价，在这种情况下，可借鉴数据库及网络资源的评价指标来对其内容进行评价。当其元素大于1时，数字馆藏的评价则主要是以各个资源个体内容为基础、以图书馆数字馆藏服务为目标、以图书馆数字馆藏保存为保障的综合评价[7]。从有关的评价指标体系看，对数字馆藏的评价涉及的评价指标较多。从具体的指标看，有些指标量的特征明显，有些指标质的特征明显，有些指标质和量的特征都不很明显。鉴于此，我们把数字馆藏评价指标分成三类：①定量指标：量的特征明显，便于计算和度量。如数据库的购买成本，利用率（单位时间内的访问量），记录或全文下载成本等。②定性指标：质的特征明显，适合进行定性评价。如数字资源的收录范围、检索界面的友好程度等。③半定量指标：质和量的特征均不明显，评价时可以利用文字资料解释说明定量指标；同时，也可以利用已有的统计数据为定性说明提供证据，如用户满意度、数字资源内容的权威性、时效性等。

3 获取数字馆藏评价指标的方法

无论是对网络数字资源还是数字馆藏，只要建立起评价指标体系和评价模型，那么，评价结果的好坏将取决于评价指标获取的质量。也就是说。能否及时准确地得到评价所需的各项指标值是关键。在实际评价过程中，这些指标值的获取经常会受到多种因素的影响：①被评价数字资源的质量。如在网页评价中，网页的作者是重要的评价指标。在万维网上，网页标明作者的不多，只有20%-31%的网页标明了作者。超过2/3的网页不能找到作者，因此就难以利用作者资历来判断网页的质量[8]。②数据采集或获取方法。例如，对于有些半定量化指标的获取可以采取多种方法，采取的方法不同，其结果也不尽相同。③数据资源系统的功能。有些外文数据库系统提供了较完善的统计功能，可以较全面、详细地获得有关用户利用数据库的情况。而有些中文数据库就不具备这样的功能，要想获取有关数据就比较困难。④时间。社会信息具有时效性，相对于使用者来说，其价值会随时间推移而减小，甚至趋近于零，这种随时间推移而使信息价值减小的现象被称之为信息价值的衰减[9]。这样在评价信息效用时，由于评价时段不同，其结果就会有较大的差别。⑤其他因素。如数字资源的存储与服务环境，数字资源使用的对象等。

3.1 定量指标的获取方法

与传统馆藏相比，数字馆藏的使用和服务必须依托计算机和网络，这也使得数字馆藏在使用和服务的过程中获取定量指标更方便和快捷。在通常情况下，定量指标的获取方法有以下几种：

3.1.1 通过服务器获取在数字馆藏服务过程中，可通过本地服务器和数据库商得到数字馆藏使用和服务状况的原始统计数据，进而得出诸如图书馆数字馆藏使用和服务中用户接受程度、服务的使用、用户培训、人力资源、成本等评价指标。这里以服务的使用评价指标为例，来说明其获取的方法。

ISO2789中的ANNEX A:Measuring the use of electronic library services有关数字馆藏服务使用的评价指标较全面、可获取性强，基本上均可通过图书馆的主页、镜像服务器及数据库商的远程服务器的日志文件获取。其他相关研究项目中有关使用的指标或统计项均以此为标准。指标包括：①Number of sessions（任务数）；②Session time（一次任务的检索时间）；③Number of rejected sessions（拒绝访问的任务数）；④Number of documents download（下载文献的数量）；⑤Number of records download（下载记录的数量）；⑥Number of searches(queries)（检索次数）；⑦Number of virtual visits（虚拟访问次数）；⑧Number of Internet sessions（通过因特网访问的任务数）[4]。

Number of sessions中的每一个session（任务）是指对一个数据库或OPAC的一次成功请求(request)，是用户使用数据库从链接成功到任务完成后退出或超时为止的过程。这个数量很容易通过服务器得到。这里需要特别注意的是：有时可能会有几个用户一个接一个地使用同一个工作站，中间没有退出行为，这时任务就无法分开，浏览器或服务器登录文件中记录的请求数就会比实际数量少。为了解决这一问题，有些系统会设一个超时时间，平均超时(time out)时间设为30分钟。

Session time指登录进入数据库或OPAC到退出的时间，在某种程度上，这一指标能表示某一特定数据库对用户的重要程度或用户对某一特定数据库的偏爱程度。这项指标也很容易从服务器获得。需特别提出的是，决定检索时间的因素较多，如用户对系统的熟悉程度、系统的帮助功能是否完善、系统本身的自动退出设置等。在对获取的指标进行处理时应考虑这些影响因素。表1是郑州大学2002年10月－2003年4月使用Ei数据库的统计。

表1 郑州大学2002年10月－2003年4月镜像服务器统计使用Ei网络版数据库的情况[10]

Month # Page# Srch# Cit# Abs# IP# SesCon U

2003-04 5111 190122721 1845 254 498

2003-0310283 381249612 3516 355 863

2003-02 5268 158822893 2211 176 3437

2003-01 5249 179224939 1944 162 3256

2002-1212255 459959267 4384 289 686

2002-11 8973 202630665 4687 178 3976

2002-10 9598 330141413 3833 228 575

3.1.2 从有关资料获取有些定量指标可以从有关资料直接获取：如从事电子资源服务的人员比例、某个数据库的购买价格（据此可算出从某个数据库下载一篇文献或一条记录的成本）、参加读者培训的人数及时间等。

3.1.3 引文分析法仍然是电子期刊评价指标的重要获取方法引文分析作为对科技期刊进行定量研究和评价的重要方法，一直深受广大图书情报工作者、科研人员及科技管理者的重视。目前影响最大，具有引文索引、引文分析和期刊评价功能的出版物是美国科技情报研究所(Institute for Scientific Information，简称ISI）出版的《科学引文索引》(Scientific Citation Index，简称SCI）和《期刊引文报告》(Journal Citation Index，简称JCR）。

目前，电子期刊多半是传统期刊的电子版，只有很少一部分是纯电子期刊。作为期刊评价的重要工具，JCR同样适用于电子期刊的评价。JCR的引文数据源于7000多种期刊，涉及到国际上3000多家出版社和200多个学科。每年的年度数据库都包含上一年的出版数据。对每一份被收录期刊，JCR Web均提供以下统计数据：引文和论文数量、影响因子、立即指数、被引半衰期、引用半衰期、源数据列表、引用期刊列表、被引用期刊列表、主题分类、出版社信息、期刊标题变化。

通过网络方便快捷地获取这些分析数据为电子期刊评价指标的获取提供了很大方便。其中的影响因子和立即指数较为重要，影响因子是评价和比较一种期刊相对于同类其他期刊影响力和重要性的指数。立即指数是评价期刊中的论文被引用的速度，或者在同一年内期刊中的论文被引用的频率，是用于比较新兴学科或尖端学科期刊的重要指标。所以，我们在评价一个电子期刊全文数据库时，往往会看这个库中有多少期刊被SCI收录，被收录的期刊的影响因子分别是多少。比如Cell 2003年的影响因子为26.626，立即指数为6.502[11]。通过引文分析，利用JCR Web可以很方便地获取电子期刊的评价指标，确定电子期刊的质量。

3.2 定性指标的获取方法

定性指标可以通过以下两种方法获取。

3.2.1 借助传统的文献评价方法图书情报界有着长期从事文献选择和评价的传统，早已形成了评价印刷型文献的方法和体系，其中很多都是基于定性的评价。数字馆藏中的一些数字资源是印刷型文献的电子版（网络版），虽然网络赋予了它们很多新特性，但这只是载体形式的变化引起的，信息内容并没有太大的区别，对其内容的评价尽管不能照搬传统的评价标准，但在某些方面可以借鉴。比如中国台湾元智大学图书馆提出的关于数字馆藏内容的一项重要评价指标：符合学科范围为原则、各学科均衡为原则[12]，就和沈继武先生的传统藏书结构评价中的学科结构评价理论有非常大的相关性[13]。类似的还有数字馆藏的语种结构评价指标等。

3.2.2 依靠工作人员的知识、经验在评价电子资源内容的同时，也不能忽视其检索系统和功能的评价，检索系统的好坏直接影响资源的使用效果。有时，同一资源会有不同的检索系统（如英国INSPEC数据库）或某一学科内容的资源有多家数据库提供商，获取单个或某类数字资源检索系统及功能的评价指标，可参考数据库检索系统的评价指标获取方法[14]。

表2 中文财经类数据库定性评价结果

检索系统和功能的评价指标包括检索功能、检索技术、用户帮助、信息来源等多个方面。由于这些指标多是非定量的，因此，获取这些指标需要相关人员有一定的学科背景、数据库知识和使用经验，并需经过多次试用、反复使用检索系统才能得到。

例如：河南HALIS管理中心在组织中文财经类数据库团购时，对国研网、中经网、中国资讯行、中宏网4个数据库试用后得到了如表2所示的定性评价结果。这些指标中有些具有客观性，可直接获取，如布尔逻辑检索。有些指标需要相关人员凭个人知识和经验进行综合考虑及主观判断后才能得到，如数据库特色等。

3.3 半定量指标的获取方法

半定量指标不能简单地通过定性或定量方法直接获取，需要经过调查问卷、统计、分析才能得到一个量值。为此，首先需要设计调查问卷，问卷应包括数字馆藏服务中可以通过此方法获取指标的具体内容，包括一般数字馆藏服务的满意度、特定数字馆藏服务的满意度、数字馆藏用户培训的满意度以及对用户帮助服务、图书馆计算机工作站和其他相关设备提供情况的满意度等[15]。调查问卷可采用三种方式：在图书馆现场填表、网上发布调查表、专家征询表。对每一项内容的评分不能简单地设为优、较好、一般、差，而应该进行详细分级记分（见表3）。问卷收集后进行统计、分析和数据处理，进而得出可以比较的指标的相对量值。

表3 用户计分标准

差一般优

1、2、34、5、67、8、9

每项数字馆藏服务的用户平均满意度可用A/B公式表示。A表示用户给出的每项数字馆藏服务期望值的总和，B表示参与该项数字馆藏服务调查的总人数。

用户期望虽然是一个非常重要的因素，但用户的选择有较强的主观性。如果用户对某一项服务的期望很低，就很容易表现出较高的满意度。如果用户对某项服务的期望很高，那么就容易表现出不满意。因此，在处理和分析数据时应该把这些因素考虑进去。

随着图书馆数字化进程的加快和数宇图书馆的发展，馆藏中数字资源的比例将越来越大，为了使数字馆藏与传统馆藏的配置更加合理，充分发挥其资源效益，最大限度地满足用户需要，对数字馆藏进行评价研究是十分必要的，我们认为有关数字馆藏服务绩效、使用及数字馆藏保存功能的评价指标宜采用定量方法获取；有关数字馆藏内容、结构等的评价指标宜通过定性方法获取；而关于数字馆藏用户满意度和存取能力的评价指标宜运用半定量方法获取的观点，仍需要通过进一步的应用评价来检验。

标签：系统评价论文; 图书馆论文;

数字馆藏评价指标的获取方法_系统评价论文

猜你喜欢