网络信息资源评价现状及构建研究,本文主要内容关键词为:信息资源论文,现状及论文,评价论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2006-05-24
〔分类号〕G250.76
1 引言
因特网的快速发展,一方面使得信息飞速增长与积累;另一方面,大量垃圾信息和对用户无用的信息也在快速增长,使得信息过载现象严重。大量的研究表明:对个人而言,获取信息是人们上网最主要的目的,但人们约有60%的时间因找不到信息而浪费。对组织而言,约有50%的潜在用户因为找不到所需信息而流失。个人和组织的共同需求也使得人们对数字信息资源的管理[1]、有效检索[2] 和评价势在必行。网络信息资源网站(网站)作为网络空间中信息的主要载体,在整个网络链路空间中处于信息节点的关键地位。因此,网站评价与方法选择在信息高速增长的时代显得尤为重要。目前,国外对网站评价进行了大量的研究,国内也开始着手这方面的研究工作,大量的网站评价方法的出现,并不意味着该领域研究的成熟,而是因为网站本身的复杂性。网站运行平台、网站实现技术、网站定位、网站内容和网站规模等的不同,使得现实网络环境中网站分析难于进行。大量的网站分析方法均暴露出网站分析缺乏统一的理论指导和严谨的实现框架。面对复杂的网络环境,若无统一的理论指导和科学的方法来支持,则很难将零散的细节问题统一起来,找出问题的关键症结所在,因此,也难以保证分析评价结果的准确性和可靠性。
2 网站评价现状分析
2.1 定性评价方法
定性评价方法主要有指标体系法和调查表法两种:指标体系法是通过设置一系列反映网站质量的指标,并由专家根据指标体系对网站进行分析评价。国外学者Betsy Richamand提出了10C原则[3],Harris Robert制定了网站评价的4条标准[4],David Stoker和Alision Cooke则建立了与Robert Harris完全不同的8条标准[5],Gemer L.Wilkinson等人在《评价标准和质量指示列表》一文中将诸多学者提出的评价标准进行综合比较和汇总,在全面分析网站特点和属性的基础上,提出了网站评价标准的11个大类125个质量指标[6]。国内学者张会田、李东曼等也纷纷针对不同类型的网站提出相应的指标体系[7-8]。调查表法是充分利用用户对网站的认知、感知和态度来度量网站对于用户所产生的效用。这种方法通常是由评价机构或个人为了解网站服务能力和经营效果,面向用户设计的一套调查问卷,并对分析处理了收集的数据,以评测网站质量。
定性评价方法能比较全面地分析网站的质量,充分利用了人对网站的感性认识,故得出的结果也具有直接性和可理解性等特点。但目前的定性评价方法仍存在如下几个问题。
2.1.1 指标体系法存在的问题
● 指标体系不完整。网站是个复杂、庞大的体系,评价的指标也非常复杂。至今,评价机构或学者提出的指标体系,尚未达成共识也说明了这一点。事实上,很少有人对网站的内、外部属性进行充分客观的揭示和综合全面的考察。
● 指标设计不合理。网站有许多属性,属性之间存在一定的因果关系,但有些评价方法并未对网站信息内容的质量与网站流量、访问量和被连接量间的关系等指标做科学的界定,使指标之间有较多重复,不具备实用性,使人们无法根据这些标准对网站的质量进行评价。
● 部分指标对象模糊。网站的组成既包含其框架结构,也包含其信息内容。但网页结构和信息内容的评价指标没有对此做恰当的区分。有些指标适用于评价网站网页,而有的则适用于评价信息内容。两者混为一谈,使得指标对象界定模糊,缺乏科学性。
2.1.2 调查问卷法存在的问题 在实施调查问卷的过程中,由于误差难以控制,特别是无法控制用户填写问卷的有效性和客观性,使得调查结果不能准确反应网站的质量。
由于定性评价方法存在较强的主观性,其评价结果容易受网络环境、评价标准、参评人员的素质和心情的制约,使得这种评价方法的操作性较差,评价结果的可靠性也较低。在实施评价工作时需要花费较多的时间、人力、物力和财力,成本高,难以适应大量网站评价的需要。
2.2 定量评价方法
定量分析方法提供了一套科学、规范、客观的评价方法,用可靠的数字来说明和分析问题。最初从分析链接数、访问次数等一些基本元素的考察分析开始,后来发展为系统的定量评价方法,国内外比较典型的定量评价方法有信息计量法、层次分析法和对应分析法等3种。
2.2.1 信息计量法(链接分析方法) 借用传统引文分析原理,是应用于网站评价的一种有效的方法。一般认为,一个网站被其他的网站链接越多,就说明这个网站的质量越好。研究还发现,网页链接关系与对发表文章的引文研究相似,但又不相同,它也符合洛特卡效应[9]。
2.2.2 层次分析法 利用人们的常规思维来处理问题,将一个复杂问题分解成若干个小问题,并充分利用人们分析、判断和综合问题的能力,对复杂问题进行量化。该方法对网站的属性进行概念划分,利用专家调查法来取得数据和权重,通过评分,确定网站的级别或排名,例如魏红梅就层次分析法在高校图书馆网站评价中的思路和方法进行了探讨。
2.2.3 对应分析方法(关联分析法) 最初由法国科学家提出,主要用于企业决策定位。英国的Berthon教授在2001年运用对应分析法对世界范围内的15家电信公司网站进行评价[11],取得了新的突破。他指出,对应分析法能够较好地评估网站的定位问题,并能够较准确地评价出网站之间的区分度。沈祥兴等[13] 也利用了关联分析法对我国的网络媒体网站进行实验性评价,通过确定网站的几个基本属性,建立关联分析的数学模型,从Alexa数据仓库中收集相应的数据,然后生成关联定位图,可进行决策定位分析,具有较大的参考价值。
定量评价方法在一定程度上克服了定性分析法的主观性和可控性问题。但是,这些定量评价方法也存在较为突出的问题。
● 链接分析法的局限性。随着研究的深入,发现文献之间的引用与网站之间的链接存在着显著的差异,链接分析法仍然存在很多问题。譬如,Stephen P.Harter和Charlotte E.Ford的研究发现,①在指向电子期刊的网络链接中,有近半数是结构性自我链接,对于评价文献的学术价值和研究学术交流行为没有意义;②在指向电子期刊链接的网页中,只有不到8%的网页是学术性的;③Thelwall通过对英国大学网站中被链接次数最多的100个网页进行分析,其结果也表明网页被链接次数并不能反映其学术价值。目前,已经达成的共识是网络链接与引文在本质上完全不同,虽然引文分析对我们开展网络链接研究具有一定的启发作用,但在借鉴时应当充分考虑到两者之间所存在的差异,对运用该方法取得的结果应进行相应的处理。
● 层次分析法的局限性。将层次分析法用于网站评价,主要有两个方面的缺陷,一是层次分析法本身存在局限性;二是层次分析法对于网站评价存在适应性的问题。层次分析法中对系统的划分和权重的取得都是人为进行的,而且评分也需要人工实施,虽然经过了误差控制,但仍不能避免人的主观性,从而使得分析的结果与实际状况存在一定偏差。组成网站的各要素之间也存在着相互影响和相互作用的关系,用层次分析法直接对其进行笼统、简单的层次划分,既改变了网站要素之间的特定关系,也使得其结果与实际情况不符。
● 关联分析法的局限性。由于关联分析法只是单纯地针对网站定位、区分度等信息评价,并没有从网站整体因素出发,不能全面系统地反映网站的综合水平。另外,数据仓库的数据本身也存在一定的问题,容易被人为篡改或者出现检测不准的情况,这对实际网站评价工作也形成了一定的障碍。
迄今为止,网站的定量评价方法均采用传统的原理和方法,这些方法为实施网站评价提供了一个很好的思路和参考,也导致对网站本身的特点的忽视和面向用户进行深入的研究忽视。另外,这些方法也缺乏对评价目标科学准确的界定,但在学术研究上却极具参考价值。
2.3 综合评价方法
用于网站评价的综合评价法有基于IA理论的网站评价和网站框架评价法两种。
2.3.1 基于IA理论的网站评价法 该方法从信息构建的分类、导航、搜索和标引系统4个方面对网站进行考察分析[13],这种分析方法通常是从用户体验的角度出发,通过用户确定使用目标、检验用户实践的效果来对网站进行评价。这种方法较之上述的定性方法而言,更加系统和科学,属于实证性的分析方法。
2.3.2 网站框架评价法 该方法根据网站的不同侧面,制定出一系列可以度量的标准,并将各项标准性指标放在一种非常结构化的框架和表格中,然后将此标准作为评价依据的一种网站评价方法。该方法既可以客观描述,又可以用定量标准来量化,评价结果比较全面,是一个折中的方法。
由于综合评价法利用了定性评价法和定量评价法的优点,综合评价法可以得到较好的效果。但在使用该方法时必须考虑处理好以下两个问题:①定性方法和定量方法比例的选择;②依比例灵活选择合适的方法,将会给评价系统带来一些误差。事实上,实施这种方法所花的代价和精力远比单纯的定性和定量方法还要多。
2.4 自动评价方法
自动评价法从网站的属性和特点入手,利用数字化、自动化、智能化的手段来解决问题,通过开发相关的自动测试软件或网站,使其能够对各类网站进行测试,自动采集测评数据,并根据建立的网站评价模型,对采集评价数据自动地进行统计、分析和计算,给出评价结果。自动测试的方法是指利用计数器、Cookies、缓存以及IP地址作为网站的分析基础数据,通过对用户访问记录分析、基于Web的站点分析服务,以及服务器日志分析等自动分析法,分析网站的使用负载和信息质量的客观评价方法,具有客观性和可靠性等优点[14]。
尽管自动评价方法能够检测出更多相关联的错误、能够提高分析特征的覆盖范围、减少专家分析意见和时间开销、融合UI(usability interface)设计和分析,但是自动分析只能作为标准分析方法,不同的技术揭示不同的问题,而对用户的满意度的主观评价,却不能用自动测试方法。但该领域还很不成熟,造成这种现象的原因有来自网站本身的复杂性。用户想了解、观测这些数据,也是非常繁琐,目前尚不具备实用性,只能作为网站评价活动中的参考因素。
3 网络信息资源评价系统的构建
3.1 评价指标体系的设置
网站评价必须根据网站自身的特点,利用自身领域的理论来指导实践的进行。已有的研究和实践并没有将网站的属性进行适当的区分,导致了指标体系设置的混乱。笔者认为,对于一个网站而言,它具有内部和外部特征,从不同的角度反映了网站的质量,网站评价应当根据这两方面展开。
3.1.1 网站的内部特征 网站的内部特征是由网站实体的各构成要素决定的,它反映了网站目标的技术实现。Newman和Landay的研究表明[15],网站是一个包括内容、导航和外观的多维复合体,可见网站内部特征的评价对象应包含内容、导航和外观3个方面(如图1所示)[16]。这样划分可避免网站要素间相互作用的影响,所以,可以利用层次分析法对其进行科学的指标设置。其中,内容评价主要是信息构建的评价,具体包括分类系统、检索系统、标识系统、信息保障系统4个方面[17-18]。导航评价则需要对全局导航、局部导航、补充导航、语义导航进行评价。外观评价针对网站的展现和布局,比如网站色彩的搭配、多媒体素材的选用等。应充分研究网站内容、导航和外观的客观属性,利用层次分析法确定其权值,形成网站内部特征评价的指标体系。
图1 网站内部评价对象
3.1.2 网站的外部特征 网站的外部特征包括流量、访问量、被链接数、速度、用户平均浏览页面数和更新时间,还包括注册用户的数量以及注册用户的使用频率。网站最终目的是面向用户。因而,用户的满意度、用户体验有关的指标也是网站外部特征的核心内容。获取这样的数据,利用关联分析法对其进行聚类分析,清晰地反映各个网站在网络上的区分度[19],这也是对网站评价的一个有益的补充(如图2所示)。
图2 关联分析法的聚类分析
通过对网站的特征分析,找出以往指标体系法中指标界定不清、指标不能切实反映网站质量、层次分析法的适应性、关联分析法的片面性等问题,形成一套基于可用性工程的以定量评价为主、定性评价为辅的指标体系。
3.2 构建自动网站评价系统
本系统采用软件工程的快速原型法,并结合面向组件(对象)的开发方法,开发构建基于B/S模式的自动网站评价工具模型系统。系统开发过程中将用到Java或.NET技术,UML建模、XML、Web Services、Intelligent Agent和Portal技术,采用基于J2EE或.NET Framework等多层开放式软件体系结构,以期实现该软件平台的可扩展性和可维护性(如图3所示)。
图3 自动网站评价系统结构
3.2.1 终端用户 终端用户使用台式电脑访问所有Web Server,以获得不同类型网站的评价(主要信息)以及网站基本开发模式(辅助信息)信息。
3.2.2 Web服务器 Web服务器提供Web浏览服务,通过分布式应用程序接口和组件接口调用后台服务器应用模块。
3.2.3 后台服务器 后台服务器是系统开发的重点和难点部分,采用基于J2EE或.NET Framework等开放式软件体系结构进行开发,以实现自动网站分析工具动态增加和调整。其主要组成部分包括Profile开发工具、矩阵计算工具和分析算法工具等。重点是建立网站标准特征库和开发智能分析比较算法。根据不同类型的网站,设计网站参数标准特征库,如网站的信息构建标准、色调标准、导航标准等,以便为比较分析提供参照。在参数标准特征库中,还应当包括有专家分析得出的各参数的权值,且这些权值因不同类型的网站而有所差异。智能分析工具按其功能可将其分为关联分析、比较分析、间接测量三大系统。关联分析系统用于对网站进行定位和区分,以去除相关干扰因素。比较分析系统用于将网站的特征值与参数标准库中的特征值进行比较,结合算法和相应分析矩阵,对网站内部的各个组成部分进行全面的分析。间接测量系统,用来测量用户的满意度和网站体验感受这两个相对较主观指标,并能间接反映对这两个指标特征参数(如平均访问量等)的分析,以客观评价用户的满意度和体验感受。
3.2.4 抓获提取器 内容抓获提取器是网站客观数据收集的重要部分,利用开发形成的搜索引擎,结合本系统的具体特点,开发适合本系统的抓获提取器,根据已经设置好的指标体系,为自动网站评价提供客观数据。提取器按照既定要求抓获网站内部和外部的特征数据,通过格式化转换提取出需要的网站客观数据。
3.2.5 DB服务器 该系统的所有数据采用数据库存放。这些数据包括基准网站的数据、目标网站的评价数据、计算中产生的数据、分析矩阵和用户浏览数据等。在实际系统中将采用分布式数据库,以实现系统负载平衡。
目前,实用性网站评价很少,现有的方法也不能全面评价一个网站的各样指标,因此,在系统总结和研究国内外网站评价研究成果的基础上,进一步探讨基于可用性工程原理的自动网站评价模型和方法,将有利于网站评价(网站绩效评价)的指标体系、评价模型、评价机制完善,提高网站的优化配置,推动政府转变职能,更好地履行市场监督和公共管理。
标签:层次分析法论文; 定性分析法论文; 关联分析论文; 用户研究论文; 定性指标论文; 系统评价论文; 定量分析法论文; 用户分析论文;