论数字馆藏的质量评价,本文主要内容关键词为:评价论文,质量论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
分类号 G253
CLASS NUMBER G253
1 数字馆藏建设现状分析
我国许多图书馆都在进行复合图书馆和数字图书馆建设。或者说,大部分图书馆都拥有自己的数字馆藏。许多图书馆没有相应的数字馆藏建设政策,对购入式数字资源缺乏质量评价意识,甚至有些图书馆仅从价格角度出发来选择数据库。对自建特色数据库和网上资源的开发(虚拟馆藏),缺乏对读者需求、元数据、开发平台和工具等的调查和研究。加之没有统一的行业标准,导致所建馆藏资源质量较差,难以满足读者要求,造成很大浪费。概括地说,目前在数字馆藏建设上较普遍存在以下一些问题:
(1)国家没有较明确的政策。图书馆学会也没有指导性的意见。
(2)在数字馆藏建设上重复建设问题严重,重蹈了传统图书馆建设中“大而全,小而全”的覆辙,不利于数字资源高度共享性效益的发挥。
(3)一些图书馆没有相应的馆藏数字资源发展政策,采购随意性很大。部分图书馆馆长并没有将数字馆藏作为现代图书馆的重要组成部分加以重视,个别只是应付检查或赶时髦,支撑门面。
(4)在数字馆藏建设方面,重资源内容建设,轻资源存储(或保存)与服务系统的建设。系统安全性差,服务能力低,难以满足读者需要。
(5)对数字馆藏的质量缺乏控制,科学管理的意识较差。
2 数字馆藏的构成分析
2.1 何谓数字馆藏
数字馆藏又叫数字化馆藏、数字式馆藏或电子馆藏等。什么是数字馆藏呢?有关文献如是说:数字化馆藏是相对于印刷型馆藏而提出的,即指图书馆馆藏中以数字化形式(即用0或1来表示)存储于特定的设备上如硬盘、光盘上的那一部分馆藏[1]。数字馆藏是指经过数字化处理,借助计算机或计算机网络利用的文献信息[2]。概括地说,数字馆藏是图书馆整个馆藏的组成部分之一,是图书馆馆藏中以数字形式保存的和借助于计算机网络可以利用的(如仅有网络使用权的外文数据库,以及其他形式的虚拟馆藏等)那部分信息资源的集合[3]。
2.2 数字馆藏的构成
数字馆藏从形成方式来看,主要有三种:一是购入式数字馆藏,二是自建式数字馆藏,三是开发式数字馆藏[4]。数字馆藏形成的方式不同,影响其质量的因素也不尽相同,需要分别加以分析。购入式数字馆藏是目前数字馆藏建设的主要方式,它主要是通过选择购买一些数字资源生产商的产品。这类资源的质量是由生产商决定的,图书馆在购买时主要是按照本馆的馆藏发展政策加以选择、辨别和判断,选择与本馆收录范围相关度相对较高、内容质量较高的产品。自建式和开发式数字馆藏,当前还只是对数字馆藏的补充和完善。也就是图书馆根据自身的需要,建设开发一些专题特色数据库或网络信息资源。这类馆藏的质量主要是由图书馆自身所决定的。而且,由于数字资源建设技术难度大,加上图书馆人员;技术等限制,各馆自建数据库等数字资源的质量参差不齐,存在问题相对较多。
3 数字馆藏内容质量评价指标
数字馆藏建设过程中所涉及的质量因素较多。尽管不同的馆藏形成方式,涉及的因素不尽相同,但有些因素是它们的共性。例如:
(1)数字资源所收录信息的质量。它是指其信息来源的质量。实际上这是构成数字馆藏中最重要的质量因素之一。
(2)数据加工的格式。数据格式不同,带来的问题很多,不仅相互之间不能兼容,读者使用不便,而且有些占用空间很大,给图书馆硬件建设造成很大负担。众所周知,计算机系统的升级换代非常快,落后的数据格式,很快就会被新的先进的格式代替。如果不及时对这时的数据格式进行处理(数据迁移),将无法利用原有的数字馆藏。所以,对数字资源的选择,技术的先进性是非常重要的。
(3)信息描述与组织方法。信息的描述有利于信息内容的揭示,信息的组织有利于信息的检索。除信息内容自身的质量外,信息的描述质量和组织方法是决定数字资源质量的又一重要因素。
(4)数据构成的时间。任何信息都存在一个半衰期,也就是过时老化问题。很显然,数字资源的时间构成不同,其质量与价值就不同。
3.1 购入式数字馆藏质量分析
(1)相对质量评价。绝对质量是指所收录信息自身质量的高低。如EBSCO是一个包含有6000多种外文期刊的全文数据库,其中ASP包含有三大检索期刊的来源刊1453种,占总收录期刊的19%。BSP包含有三大检索期刊的来源刊427种,占总收录期刊的11%。这就是绝对质量。
相对质量是指每个图书馆都有自己明确的(专业学科)收录范围,这是由它所服务的读者对象决定的。对于一些数据库(现在大多数数据库不提供个性化的服务,有个别有,也只是十分有限的个性化,在他们所确定的范围内的个性化,而不能按照用户的需要而选择),由于图书馆不能按照自己所需的专业学科来选择订购,这样,所订资源中只有部分,甚至只有少部分内容是本馆需要的。这必然影响馆藏的整体质量。实际上是指资源与收录范围的相关度。
(2)一次文献信息的数量。数字图书馆的馆藏由两大部分组成:元数据库和数字对象库(一次信息库)。数字图书馆的魅力就在于,人们通过它可以获得自己所需的一次信息。所以,数字馆藏中一次文献信息的数量非常重要。如EBSCO中ASP收录期刊2929种,含全文期刊1379种,占总期刊量的47%。BSP收录期刊2349种,含有全文期刊1686种占总期刊量的72%[5]。
(3)数据库检索系统的先进性等。数字资源与纸质文献不同,它必须借助一定的系统才能使用。通常在购买数字资源时,就购买了系统平台。不同的系统平台,检索的效率,界面的友好性、方便性等都有不同,直接影响读者的利用和数据库效益的发挥。
3.2 自建式数字馆藏质量分析
每个图书馆都有自己的特色馆藏,为了保护或进一步提高馆藏利用率,通常将它们加工成馆藏特色文献数据库。尽管目前各馆自建的数据库不多,但这是数字馆藏建设的重要途径之一。建设时,除考虑以上因素外,还应考虑选题的新颖性、针对性和特色性,数据内容的准确性、完整性、描述的规范性,管理系统的先进性、方便性,可维护性以及效益性等[6]。
3.3 开发式数字馆藏质量分析
开发式数字馆藏,通常指的是对因特网信息资源的组织、开发和利用。网络信息内容评价指标体系较为适合对这部分馆藏的评价,具体指标有:权威性,准确性,新颖性,客观性,针对性,覆盖面,切题性,设计与美感等[7]。
3.4 数字馆藏的整体评价
数字馆藏评价(digital collection evaluation,DCE)是对数字图书馆(或复合图书馆)的数字资源体系(digital resource system,DRS)的建设状况、功能及其利用的情况进行检测和评价。对数字馆藏质量的评价是对馆藏数字信息资源集合质量的评价。其评价除以上有关指标外,还应包括相关性(relevancy)和完整性(completeness)[8]。这两个指标对数字馆藏的评价很重要。相关性是指每种资源与图书馆收录范围(或满足读者需求)相关度。对多种资源集合的数字馆藏来说,还包括各种资源之间的交叉度。完整性是指作为一个信息集合,必然具有一定的结构。这里指数字馆藏的学科结构和不同资源类型的组成结构。
在数字馆藏评价时,必须认识到单个或单种数字资源的质量,与馆藏所有资源的整体质量是不同的。例如(假定评价标准为5分制):资源A的质量为4,资源B的质量为3,那么资源A+B的质量是多少呢?是C,C不等于3+4,而是大于等于3,小于等于4。这是由于有许多资源有交叉或重复。例如中国数字图书馆公司、北京书生数字技术公司和超星数字图书馆的电子图书都有不同程度的重复。这样,即使购买了三家公司的电子图书,但对读者需求的满足程度并没有很大提高。所以,对数字馆藏质量的评价要比对单种资源的评价复杂得多。不仅需要考虑各种资源的质量,而且要考虑馆藏数字资源的配置问题。馆藏资源配置质量可以从三方面考虑:馆藏数字资源结构的合理性,馆藏数字资源的系统性,资源利用率和用户满意度[9]。
4 数字馆藏评价原则
馆藏评价是按照一定的原则标准进行的。这些标准对馆藏发展具有明显的导向作用,它决定着馆藏发展的基本模式,直接影响图书馆信息资源系统功能的发挥[10]。数字图书馆是对传统图书馆的继承和发展。传统图书馆中对馆藏评价的一些标准和原则仍然适用于数字图书馆中对数字馆藏的评价。但是也存在一些不再适用的标准和原则,就是说,传统馆藏评价理论在评价数字馆藏时有一定的局限性,需要发展新的评价理论。
盛小平认为,数字图书馆馆藏评价应该基于如下7个原则:可靠性、合理性、可用性、全面性、权威性、时效性和经济性[11]。我认为这7个原则,对于数字馆藏的评价来说,不够准确全面。
数字馆藏是馆藏数字信息资源的集合。其最大的特点就是高度共享性;信息不受时间地域限制,时时处处可得,也就是使用的方便性;信息易于检索,下载复制,这是可获得性;相对于纸质文献购买成本、存储成本和利用成本都低,这是经济性。虚拟馆藏分布在不同地域的多个图书馆中,这就需要合理布局与协调。
另外,是否可以将“合理性”改为科学性,“可用性”改为实用性,“权威性”改为准确性,“全面性”改为系统性更好些呢?然后,再增加共享性、可获得性和特色化与协调性三个原则。因而笔者认为,数字馆藏评价应遵循以下10个原则:准确性、可靠性、科学性、实用性、全面性、可获得性、特色化与协调性、时效性、共享性和经济性。下面对个别原则加以说明。
经济性。经济性在数字图书馆和数字馆藏建设中表现在三方面:一是获取成本大幅度下降。用户可以用比以前少得多的时间和资金获得比印刷型文献更多的信息。二是图书馆资源建设费用降低。在我国数字资源的购买成本通常仅为印刷型文献的几分之一到几十分之一,即使加上数字资源的存储与服务设备成本,仍然低于传统馆藏的建设成本。三是电子存储比纸张存储便宜。到1987年,在CD-ROM上存储文档的费用已低于图书馆存储书籍的费用。在计算机中保存大多数格式的数据比在图书馆中保存实物作品便宜[12]。
可获得性。国际标准组织在对ISO2789标准的修订版草案中这样定义图书馆馆藏:图书馆为用户提供的所有文献。包括本地馆藏文献和有获取权的远程资源。获取权可以是图书馆、集团或外部资金。获取权=仔细选择权+安全的获取权+包括OPAC和其他图书馆的数据库。不包括因特网资源的简单链接[13]。该标准中的馆藏实际是复合图书馆的复合馆藏,但其中突出了数字资源的获取权,这也就是需要强调的数字馆藏可获得性原则。
特色化与协调性。数字图书馆不同于传统图书馆,数字馆藏可以分布式存储在不同地域的若干图书馆或其他机构中。这要求数字图书馆不能搞“大而全,小而全”。必须强调各自的特色化,加强合作和协调布局。
5 数字馆藏评价的方法
传统馆藏的评价通常采用定性评价、定量评价以及定性与定量相结合的综合评价方法。数字馆藏在构成和使用等方面都有别于传统馆藏。所以Cynthis Dobson认为,在同时存取与拥有信息的环境中,需要应用新的评价方法,特别是在跨学科领域,资料被分散在各地图书馆馆藏中时[14]。数字图书馆是因特网重要的组成部分,是对外提供信息服务的网站,其数字馆藏是因特网上经过组织的、质量较高、价值较大的网络信息资源。其评价方法也可以有别于传统馆藏的评价或借鉴网络信息资源的评价方法(评价指标体系并不同于网络信息资源)。网络信息资源评价可分为第三方评价、网络信息资源用户评价和网络计量法评价。
(1)用户评价法。用户评价法是各类评价中较常使用的一种。这种方法通常是评价机构选择一个指标体系告知用户,让用户按照指标对其质量的高低、服务的好坏等进行评价。在评价过程中,用户一般采用定性评价。这种评价方法简单易行,适合于较为简单事物的评价。对于数字馆藏,由于其来源多样,数量巨大,使用复杂,用户要想全面了解是很困难的,或者说,需要用户投入大量的精力与时间,这增加了用户的负担。另外,用户也没有评价的职责,难以管理。所以,对于数字馆藏的全面评价仅使用用户评价法,结果可能不够全面和客观。但对于某些难以量化的评价,可以采用用户评价法。
(2)第三方评价法。第三方评价法主要是相对于网络信息资源的发布者(所有者)以及网络信息资源用户而言的。目前的主要形式有:商业性的专业网络资源评价网站,如Magellan Internet Guide(http://www.mckinley.com)、Lycos Top 5%(http://point.lycos.com/categories)、Argus Clearinghouse(http://www.clearinghouse.net)等。评价的范围多侧重于综合性网络资源,面向普通网络用户,所选择的评价指标体系包括日访问量、网站设计的感官效果等,注重网络资源的形式而不注重信息内容。由图书馆所提供的网络资源评价服务,一般针对学术信息资源评价,具有专业性,采用的评价指标体系多侧重于信息内容,且考虑网络信息的权威性、学术性,是专为科学研究而服务的,如ADAM(http://adam.ac.uk)、EELS(http://www.ub2.lu.se/eel/)、OMNI(http://omni.ac.uk/)、SOSIG(http://www.sosig.ac.uk/)等[15]。
第三方评价法是目前较为普遍使用的一种方法,但也存在一些缺点,如评价的可信性、滞后性等。另外,第三方评价法多侧重于综合性网络资源,对提供专业学术性服务的数字图书馆关注不够。因而,对数字馆藏的评价如何借鉴需要研究。
(3)网络计量法。由于用户评价法和第三方评价法都存在一些不足,因而有专家提出依据网络信息资源自身的规律进行定量评价的思路,由此产生了cybermetrics或称webometrics等新的研究领域[16]。网络计量分析法是网络环境下文献计量学的发展。理论上它可以提供一个系统、客观、规范的数量分析方法,评价结果更加客观,是网络信息资源评价的一个重要发展方向。不过,网络计量法目前也还存在许多问题,如链接与引用的关系问题。另外,实际评价中还有许多指标难以量化或获取,这也是定量评价的局限性。
概括地说,由于数字馆藏构成较复杂,涉及的因素较多,单纯运用定性或定量评价都难以非常准确、客观和全面。我认为,使用定性分析、定量评价相结合,并采用层次分析法构建一个评价模型,将定性与定量指标加以综合,构成一个统一的指标体系加以评价,相对较为科学。