网络信息资源评价相关问题,本文主要内容关键词为:信息资源论文,评价论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
与有着信息质量控制机制的传统信息发布和传播模式相比,自由、开放的因特网为用户提供了更为方便快捷的以及更为广泛的信息获取渠道,但在为用户提供浩如烟海信息的同时也造成了信息过载以及信息污染等传统信息环境下不易出现的新问题。越来越多的专家开始关注网络信息资源的质量问题,并呼吁对网络信息资源开展同传统信息环境下评价纸质文献一样严格的质量评价[1]。 这不仅因为网络出版具有自由和自发特性,信息发布缺乏质量控制机制,更因为在虚拟环境中,用户很难从作者权威性、出版机构权威性和新颖性等印刷体信息环境中常用的评价信息资源质量的指标中判断网络信息资源质量。因而,建立科学、合理的网络信息资源评价方法和指标,为用户提供具有较高可信度的网络信息资源评价服务越来越受到人们关注。
1 网络信息资源评价中的基本问题
1.1 信息质量的相对性
网络信息资源评价实质上是对网络信息资源的信息质量进行评价。质量并不是一个绝对的概念,根据不同的主体以及相同主体不同的需求,质量常表现出不同的要求及不同的内涵。广泛接受的一个关于质量的定义是由ISO组织提出的:质量是产品或服务满足现实和潜在需求的能力所表现出的整体性状与特性[2]。因而,信息质量是与用户需求相联系的,具有很强的“场景”(Context)特点。
质量经常用一系列“质量要求”来表示,描述和评价一个实体的质量或对其实行质量控制,首先需定义或规定一系列的定性或定量的质量要求,然后依次考察和评价实体是否达到或实现这些要求。质量指标体系必须符合不同的主体及相同主体不同的需求,根据不同的评价目的和评价对象选择不同的指标种类。在评价网络资源质量时,必须考虑网络资源用户的差异,包括用户的知识差异、信息需求差异等。网络信息资源的评价不需要也不可能有绝对的和统一的质量标准,因为其核心在于评价网络信息资源的“效用”问题,即网络信息资源是否满足特定用户群特定的与潜在的信息需求,这就需要根据不同的评价目的和评价服务对象(即用户群)将评价指标划分为不同的层次,决定评价的深度并选择相应的评价方法。
1.2 网络信息资源评价的用户
在网络信息资源评价中,明确评价目的和特定的用户(即评价服务对象)非常重要,这是整个评价工作的起点。如网络中的环境信息资源,其用户包括科学研究人员、政府机构和非政府机构工作人员、学生(包括中小学生、大学生及研究生等)、工商企业人员以及普通公众等,各自不同的用户群对于环境信息的需求存在巨大差异。例如,提供环境质量数据的网站对于环境科学研究人员往往是重要的信息源,但对普通公众则是不适宜的。不同用户群适用不同的网络资源,相应针对不同用户群开展的网络资源评价也具有不同层次的评价指标体系和评价方法。
1.3 网络信息资源评价的模式
目前在实践中,开展网络信息资源评价服务的模式主要有“网关”(Gateway)模式与第三方认证模式。 “网关”模式主要集中在图书情报机构所提供的网络信息资源导航服务领域,其评价的重点在于网络信息资源的信息内容,主要考虑网络信息资源内容的权威性、正确性等,尤其是网络资源的学术价值。这种模式有美国威斯康星大学的“The Internet Scout Project”(ISP),美国Health Information Technology Insitute(HITI)的“Mitretek System”,英国UKOLN 的“DESIRE”,英国的“OMNI”以及“SOSIG”等。 认证模式主要集中于具有商业意味的评价网站中。它们提供网络信息资源的选择、评价和评级服务,所提供的评价或评级结果比较直观,采用星级或有代表意义的图形,如Yahoo!Internet Life(YIL)(http://www.zdnet.com/yil/)的评价结果为一星至四星级[3]。但这些专业评价网站所选择的评价指标大多以网络信息的形式为导向,更多考虑的是主观的判断、站点的设计和易用性等特点[4]。 从评价的准确性及对用户发现网络资源的帮助来看,“网关”模式价值更大,这是网络信息资源评价应该坚持的方向。
1.4 网络信息资源评价的标准化和针对性
网络信息资源具有高度离散、非结构化、异源、对计算机系统依赖性较大等特性。网络信息资源的分散性表现在:①网络信息资源表现为不同的形式,如网站、邮件列表、新闻组等,网站中又可包含电子期刊、数据库、多媒体信息等各种格式、各种内容的信息内容;②网络信息资源主题繁杂,几乎所有内容的信息都可在网上找到;③如前所述,网络资源的适用用户与服务的对象各不一样。网络信息资源的离散性决定了无法也无必要寻求一个适用于所有网络资源的标准化的评价指标体系和评价方法。然而,存在适合于所有网络信息资源的基本的评价指标,如网络资源的可获取性等。可以在这些基本的评价指标的基础上构建适用于特定领域、满足特定网络资源用户需求的评价指标体系。
1.5 网络信息资源评价的主体
毫无疑问,人是网络信息资源评价最主要的承担者,因为绝大部分评价指标必须由人来判定分值的高低。但基于人的主观判断及采用主观性指标的评价也存在诸多缺点:评价以人工方式进行,不可避免地受到主观价值的影响;各个评价机构采用的评价标准和评价指标体系也不尽相同,在一定程度上影响了用户对评价结果的接受,也降低了评价的可信性;评价过程相对时间花费过大,等等。一篇文章指出:对多数从事网络信息资源评价的专业机构和网站来说,其采用的评价指标缺乏严格的筛选和鉴别;在动态的因特网环境中,采用静态的工具和系统方法去评价网络资源是困难的,甚至是不适宜的[4]。随着研究的发展, 一些脱离人的主观判断,需通过计算机手段确定的评价指标逐渐被引入。如文献[5]提出通过元数据、通过因特网内容选择平台(PICS )评价网络信息资源。另外,借鉴印刷体信息环境下引文评价的思路和方法,研究者提出Web影响因子的概念和网络引文分析的方法[6~8 ]。这些方法都摆脱了人在评价过程中由于个体知识水平、学科领域背景、信息需求状况等的不同而导致的强烈的主观性,使得评价结果可在统一的基准上进行比较。选择可比的客观性的指标,利用计算机系统进行网络信息资源评价较纯粹采用主观性指标来说,具有方便、快速、客观、公正、评价范围广等优点。在网络信息资源评价中引入精确的定量手段,将评价交于计算机系统来完成已成为未来的一个发展方向。但从根本上来说,网络信息资源评价是一个价值判断过程,脱离不了用户需求在不同时段、不同环境下的差异,从而使得网络信息资源评价不能完全由计算机进行。适宜的做法是,考虑所有的可反映网络资源质量的指标,将可以进行度量的指标通过科学的计量方法和手段进行度量,必须由人完成的主观性指标则努力寻求更客观的方法去度量。
2 网络信息资源评价指标的设置
指标体系的设置是网络信息资源评价的核心问题,决定了评价的成功与否。从现有的研究与实践来看,很多评价指标体系缺乏科学、合理的基础,即对指标层次、指标类型以及指标赋值等基本理论问题缺乏深入的探讨与描述。
2.1 评价指标的层次性
由于网络信息资源质量表现出不同的实用性和层次性,其评价指标也依据不同的评价要求和评价服务对象表现出不同的层次与类别。我们可以将网络信息资源评价指标划分为3个层次(见表1)。
表1 网络信息资源评价指标的层次
指标层次 适用范围
适用于所有网络信息资源的评价,为
第一层次 基本质量要求,如资源可获取性、站
(基本要求指标)点设计等
第二层次 适用于特定主题领域,如医疗信息领
(主题领域要求指标)域、环境信息领域等
第三层次 适用于主题领域,如医学学术信息、
(用户专题要求指标)环境科学研究信息等
第一层次,适用于评价所有网络信息资源的通用指标,这些通用指标大部分反映网络资源的技术特征,如速度、易用性、死链接数量、有无文字拼写错误等。
第二层次,应用于特定主题领域的所有信息资源,而不管其目的和专指的服务对象。如所有医学网络信息资源评价指标。
第三层次,为满足特定用户群的特定专题资源评价需求,如环境科学研究人员对于环境科学学术信息资源评价的需求。
2.2 评价指标的类别
应用于评级的网络信息资源质量指标可分为直接评价指标和间接评价指标。借鉴传统印刷体信息环境中的“SCI ”评价方法以及期刊影响因子和作者影响因子等评价指标,在网络环境下,也可引入Web 影响因子等间接指标对网络信息资源进行评价[6]。实践中也进行了尝试[9~11]。利用Web 影响因子等间接指标对网络信息资源进行评价的研究正在进行,所进行的实践工作大部分也只是尝试性的。目前,网络信息资源评价大多还基于网络信息资源的直接指标进行。
目前,提出的网络信息资源评价指标种类很多[4,12~18], 有基于信息内容的分类,有基于信息形式的分类等。本文提出基于信息查寻过程中的主客体分类方法。
从信息查寻的角度看,信息的质量受3 种主要因素影响:用户的感知、信息自身的特性以及获取信息的过程。这3 种因素对应于信息查寻过程中的主体(用户)、客体(信息源)以及主体对查寻结果的预期。可以从这3个方面确定网络信息资源的质量指标类型(见图1)。
图1 基于信息查寻的网络信息资源评价指标类型
用户——主体指标。毫无疑问,用户是确定信息质量评价指标的最重要的依据。主体指标是指那些只能由用户根据自身的观点、经历与背景进行赋值的指标。考察用户的信息需求状况,可得出很重要的信息质量指标,尤其是一些主观性指标,如文献的相关性和可理解性等。现有的网络信息资源评价基本上是以用户为导向的。但以用户为导向往往是费时费力的,且存在评价的准确性、权威性和客观性问题,因此不能单纯依据主观性指标评价网络信息资源,而应该引入客观性指标体系以增加评价的客观性和可比较性。
信息源——客体指标。网络信息源的自身状况,如发布机构、整个网站的信息完整性等可间接反映网络信息源的质量高低。对于网络信息资源评价来说,“.edu”、“.org”等网站发布的信息其价值以及信息的准确性和权威性等都要比“.com”、“.net”要高。另外,网站的界面设计、站点内检索性能的高低也在一定程度上反映了站点信息质量的高低。客观性指标通常需要详尽分析信息源方能进行赋值。
查寻过程——过程指标。在网络环境下,网络信息资源表现出与印刷体环境下信息资源不同的特性。在网络环境下,信息资源具有不稳定性,且存在与用户的交互过程。因而,与网络信息资源获取性相关的指标体系是网络信息资源评价指标体系的重要组成部分,也是网络信息资源评价区别于印刷体信息资源评价的一个显著特征。有关查寻过程的指标包括信息源与用户的交互状况、网络信息资源的稳定性、网络资源的易获取性等。过程性指标需实际考察网络信息资源获取过程方能进行赋值。这类指标具有客观性、可比性,但也具有瞬时性,一次评价的结果往往不能反映真实情况,需多次进行评价。
3 网络信息资源评价方法中的问题
3.1 准确性和可操作性问题
评价信息资源质量存在准确性和可操作性之间的矛盾问题。从原则上讲,评价应保证一定的准确性,并具有一定的可操作性以使评价者依据评价指标能在相对统一的尺度上开展评价。但准确性与可操作性往往是矛盾的,并不能同时实现。为提高评价的准确性,评价指标体系应考虑不同的要求、划分不同的层次,并且体系严谨、科学、详尽;而可操作性则要求实际应用评价指标体系时能尽量减少对评价标准的歧义、评价尺度的偏差,易于应用。
为达到准确性要求,评价指标必须详细界定并经充分描述,这是准确评价的基础。对于主体指标(面向于用户),其准确性与用户的情况相联系,不存在符合所有用户需求的一个准确性判断。对于客体指标(面向于信息源),由于信息源自身性状的多样性(如组织结构、信息格式等),提高客体指标的准确性比较困难,这需要对网络资源进行全面和详尽的调查与分析,但从时间和条件上往往不允许。通常采用选择信息源中具有代表性的部分替代整体进行评价,因而,选样的准确性(包括样本的范围和选样技术)决定了评价的准确性。对于过程指标(面向信息的可获取性)的评价,其准确性最难保证,通常其准确性取决于时间,即评价时间选取。在可操作性方面,评价指标体系和评价方法的设计应以方便应用为导向。任何评价方法应易于被评价者和用户理解、掌握,并具有可移植性,即适用于新的资源评价和加入新的评价要求和因素。对于主体指标,考虑到用户的时间限制,问卷应尽量间接,对各项指标应给出默认值。客体指标,应考虑到时间和经费开销问题,特别对于需进行连续评价的指标来说。过程指标的可操作性要求与客体指标的类似,时间花费是关键因素。
3.2 指标的评分单位与范围
评价指标必须设定指标的评分单位与范围。主体指标的单位比较难以确定,如“可理解性”就没有明显的单位,一般只有级别。由于主体指标与评价者和用户的主观判断相关,在主体指标的单位能够确定的情况下,主体指标单位的设计应直观、简单并加以明确界定。另外,指标值的范围也必须明确。一般指标值采用十分制或百分制,也可采用其他方法,如分级。无论采用何种方法,都应明确告知评价者或用户,同时给出默认值。
3.3 主体指标评价
根据前面的定义,主体指标为那些由用户和评价者评价、赋值的指标类型。在主体指标评价、赋值过程中,必须注意以下一些问题。
·主体指标必须严格界定,其定义应简短、简洁,没有歧义。主体指标可以详细分解,越详细越利于用户和评价者进行判断和赋值。如果定义不明,界限不清,评价时易导致赋值不准确。
·明确指标赋值范围,并给出默认值。
·尽量为每一项指标提供范例,包括质量优良和质量低劣的。
3.4 客体指标评价
大部分客体指标的赋值可以脱离主观判断的制约,可在统一的基准上进行比较,如网站建立机构的权威性、网站结构的完整性、链接是否保持畅通等。客体指标可寻求一个基准值,将评价对象与其进行比较。考虑到网络信息资源自身的复杂性和多样性,评价客体指标时,选样的科学与成功极为关键。另外,由于网络资源经常处于剧烈变动之中,对于客体指标的评价应持续进行,即对同一个指标持续进行评价,以保证最终结果的准确性。
3.5 过程指标评价
因为过程指标的评价依赖于网络环境中软硬件状况,过程指标常采用统计的方法,并借助计算机软硬件的支持。在过程指标评价中,值得注意的是评价的持续性,因为一次评价往往不能反映资源的真实情况。在持续评价过程中,应注意每次评价所选择的时间,尽量选择可比的时间段。
标签:赋值论文;