国内外网站评价研究的比较与分析_定性指标论文

国内外网站评价研究比较及分析，本文主要内容关键词为：国内外论文,评价论文,网站论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：G250.73文献标识码：A文章编号：1003-6938(2006)03-0028-06

随着因特网的普及，各种网站如雨后春笋般纷纷涌现，网站数量巨大、质量良莠不齐、垃圾信息充斥等问题的出现，严重干扰了人们查找和使用所需信息。如何评价网站和识别信息成为国内外研究者关注的焦点。本文在相关文献统计的基础上，对国内外网站评价研究进行了比较和分析，试图发现其中存在的不足，并提出有关建议。

1 文献调查过程

2005年12月21日，笔者以“题名=网站*评价”为检索策略，利用CNKI数字图书馆南开大学镜像分站，检索中国学术期刊全文数据库(1994年至2005年)、中国优秀博硕士学位论文全文数据库(1999年至2005年)、中国重要报纸全文数据库(2000年至2005年)和中国重要会议论文集全文数据库(1999年至2005年)，总共得到87篇文献。同时，利用维普信息资源系统镜像站，检索《中文科技期刊数据库》(全文版)(1989年至2005年)，得到54篇文献。另外，利用天宇全文检索系统，检索《人大复印资料》(1998年至2004年)，得到3篇文献。笔者对检索到的文献进行辨别，剔除重复文献和2篇误检文献(一篇是《网站创建与学生发展性评价探索》，另一篇是《环球资源网站获国际高度评价》)，最后得到91篇相关文献，其中报刊论文86篇，硕博士学位论文4篇，会议论文1篇。

2006年4月17日，笔者又以“((evaluate)in ABSTRACT)and((web)in ABSTRACT)”为检索策略，通过南开大学图书馆站点，检索Emerald全文电子期刊(Emerald Fulltext)，得到36篇相关文献；在此数据库中，以“((appraise)in ABSTRACT)and((web)in ABSTRACT)”为检索策略，检索得到5篇相关文献，剔除重复文献，最终得到39篇相关文献。虽然此检索结果受到Emerald全文电子期刊收录论文的限制，但仍可通过分析这些文献，了解国外网站评价研究的情况。

2 国内外网站评价研究比较

2.1 年代、期刊和研究者分布

笔者首先就国内外网站评价研究文献中所反映出来的年代分布、期刊分布和研究者分布进行了比较。

(1)年代分布：从检索到的文献看，国外对网站评价的研究较早，始于1997年，国内则比国外晚3年，研究成果都不甚丰富。国内研究者对此课题的兴趣升温较快，除2002年的相关论文数略有降低外，研究成果数量增幅较大，2004年的发文数将近为2000年的12倍，这与我国近几年信息化高速发展密切相关。国外研究者则保持平稳的兴趣，每年的发文量相差不大，1997年至2005年间，年发文最大值与最小值间仅相差5。

(2)期刊分布：从刊载论文的期刊来看，分布都较为集中。IT界和图书情报界是国外研究该领域的主体，企业管理界也对此有所关注。相比之下，国内研究该领域的期刊分布较广，图书情报档案期刊是发表该领域文章的主体，此外，社会科学综合、自然科学综合、计算机、工农业、管理、通讯、教育、哲学和医学等期刊也有所涉及。国外研究者来源较单一可能是论文数量较平稳的原因之一，国内研究者来源广泛能够推动该课题论文数量的增长。

(3)研究者分布：国内外该领域研究者都比较重视合作研究，呈现出研究机构既集中又分散的双重特点。从国内看，20％以上的文章来自武汉大学和南京理工大学，将近80％的文献分散在其它54个机构。在国外，30％以上的作者集中在6所机构，将近70％的作者来自其它40个机构。国内论文的第一作者有92.77％来自高校，国外论文的作者有82.89％来自高校，可见，高校研究者是该研究领域的主力军，其他单位(科研机构、公共图书馆、企业和政府机关等)的研究者也对此有所涉足。从研究者的地理分布来看，我国大陆地区，对该课题未展开研究或研究较少的省市，主要位于中西部经济欠发达地区；国外作者除3名国籍不详外，其余作者来自11个国家，除土耳其和印度外，另9国都是发达国家。可见，经济、信息化建设和科研之间能够相互促进，经济发达地区，信息化程度较高，高校和科研机构较多，对网站评价的研究成果也较多。国内外都是如此。

2.2 主题类型分布

主题类型可根据评价内容和被评网站的类型来划分。

(1)根据评价内容的不同，网站评价研究可分为整体评价、具体评价以及评价方法三种类型。国内研究者最感兴趣的是对国内网站进行整体评价，这方面的论文数占到总数的68.13％；其次是具体网站的评价，占到20.88％；而对网站评价方法的研究起步较晚，成果较少，但年发表论文数增幅较大。相比之下，国外研究者的研究重点是后两个方面。这说明，国内较重视概括性的研究，而国外更重视针对性的研究，并强调评价的可操作性。

(2)根据被评网站类型的不同，网站评价研究可分为全体网站评价和某类网站评价。针对全体网站的共性进行评价是我国关注的焦点，针对全体网站评价研究的论文数超过总数的五分之一，可以说明这个问题。针对某类网站的评价也是研究者的兴趣所在，被评网站类型大部分集中在图书馆网站、政府网站、教育网站、电子商务网站和学校网站，而对其它类型网站评价研究很少或没有开展研究。笔者认为，其原因在于：①行业信息化，学校(尤其是高校)、政府、图书馆等行业的信息化程度较高，图书馆网站、政府网站、教育网站、电子商务网站发展迅速，数量较多，但质量参差不齐，急需对其进行科学评价，并加以规范，很自然地，吸引了许多研究者。相比之下，其它类型的网站，如邮政网站、历史网站、博物馆网站等，数量相对较少，缺乏对研究者的吸引力。②研究者身份，图书情报界是网站评价研究成果发表的主要领域，该领域的研究人员构成了网站评价研究队伍的主体，同时他们对教育、图书馆、学校和电子政务等接触较多，了解较多，很自然地，对这些网站的评价也更为关注。与此相反，国外的关注重点则是某类网站的评价研究，更强调各类型网站的特性，注重针对性评价，即更重视评价研究的实用性。

2.3 内容分布

在评价内容方面，国内外相差不大。国内主要集中在网站评价的原则、意义、评价方法和评价指标体系四个方面。国外主要集中在网站评价原因、目的、评价方法和评价指标体系。

与国外相比，国内更注重原则研究，认为网站评价应遵循以下原则：评价指标立足于网站用户，以内容指标为主，指标体系全面、科学、针对性强、动态发展，便于评价操作等；国外虽未明确提出这些原则，但实际上也是在这些原则指导下开展研究的。较之国内，国外更注重原因研究，认为网络信息数量巨大、增长迅速、真伪难辨、良莠不齐，要想有效利用网络信息，就必须对其进行识别和评价；当然，这些原因在国内论文中也有体现。国内外在这方面高度相似，原因可能是我国信息化建设晚于发达国家，信息化程度较低，网站评价研究起步较晚，参考和借鉴了大量国外成果。

2.3.1 研究目的

国内认为网站评价的目的在于便捷用户使用网站和扩大网站影响，这是从“用户”和“网站”这两个不同角度对同一问题的表述。例如：陈雅和郑建明认为，网站数量巨大、信息繁多、质量参差不齐、物理建设水平不均，不利于用户利用网站，需要一套评价体系对网站进行评价，促进网站规范化，方便用户通过浏览网站获取信息。[1] 王伟军认为网站评价可以帮助网站“扩大知名度”、“吸引新用户”、“增加保持力和忠诚度”、“了解行业竞争状况”和“促进网站更加重视用户的满意度”。[2]

国外一般站在用户的角度评价网站，旨在帮助用户对海量网络信息去粗取精，去伪存真。用户对网站的识别能力提高后，网站被用户“物竞天择”，优胜劣汰，从而也达到提高网站质量和用户满意度的目的。例如：Hope N.Tillman站在用户的立场上，分析用户如何利用网络信息资源，提出评价网络信息的基本标准，并提供了网上常用的一些网站评价工具。[3]

在国内外研究目的相似的基础上，国外更注重从用户角度进行研究，这根源于英美等发达国家以人为本、追求人性和人权的传统，这是我国研究者需要注意的，因为只有从用户出发，才能促进网站树立用户至上的观点和培养服务用户的意识，提高用户满意度，从根本上提高网站质量。

2.3.2 研究方法

我国研究者认为，评价网站应采用集主观评价和客观测评为一体的综合评价法，因此信息框架法、层次分析法和对应分析法这三种综合分析法是研究热点。如：李东曼和郝金星在《网站信息框架评价法研究》一文中分析了国内外的网站信息框架评价法，提出了创新的网站信息评价框架，并分析和说明了建立的标准和采用的方法。[4] 王道林和刘书堃用层次分析法设计网站评价数学模型。[5] 沈祥兴和李东旻在文章《关于对应分析法对中国媒体网站评价的研究》中提出对应分析法，并在构建对应分析评价模型的基础上，对我国媒体网站进行抽样评价。[6]

国外研究者重视实证研究，用研究的理论成果去指导网站评价实践，再在实践中修改和完善评价理论、方法和体系。如：Helge Clausen陈述了“WWW上图书馆网站评估新方法的发展”项目，该项目构建了质量指标表，并对丹麦三个高校图书馆网站进行了测试评价。[7]

与国内相似，国外主要采用定性评价和定量评估两种方法进行网站评价，但国外对网站定性评价较多，如：美国肯特州立大学的图书馆和媒体服务中心设计的网站评价问卷从作者、网站目的、准确性、时效性和可用性五个方面提出20个问题，旨在帮助用户评价网站。[8] 对网站定量评估注重评价指标的可操作性，一般在用户点击率、浏览网页数、链接率、被链接率、网络影响因子等方面设置定量指标。

可见，虽然国内外都采用定性和定量的方法评价网站，但国内主要研究定性和定量相结合的综合评价法，国外虽然也有综合研究，但重点还是定性评价，指标取值强调可操作性，且更注重实证研究。忽视理论与实践的联系，忽视实证研究和案例分析，喜欢纸上谈兵，是我国多数研究者的通病，势必会影响网站评价研究的发展。

2.3.3 评价指标体系设置

对网站评价指标体系的研究，是该领域的研究重点。国内外研究者提出的指标体系基本相似，主要包括网站的整体形象、内容、结构、功能、技术、美工和效用等，并提出了一些评价网站的参考资料来源。这反映了在制定指标体系方面，我国主要借鉴和参考国外成果。

(1)国内研究的网站整体形象指标包括建立网站定位(观点取向)、目标用户定位、版权所属、各种许可证、认证情况和域名等。如：胡冰川等设计的整体评价指标包括域名和网站认证。[9] 国外主要从目标用户及其需求，网站目的，网站类型，域和网站主办单位等来评价网站的整体形象。如：Joe Barker在《评价网页：提供的技术和要问的问题》中提到分辨个人网站和其他网站，分辨网站域的类型，网站主办单位实力情况，网站目的等方面。[10] 但总体而言，国内外对网站形象评价的重视都不够。网站整体形象决定了网站信息的受众群、真实性和权威性等，如果忽视对整体形象的评价，不利于网站提高自身形象，也延长了用户判断信息有效性的时间。

(2)国内外普遍认为，信息是网站评价的最主要对象，都将对信息的评价分为信息内容和信息组织结构的评价，一般设置定性指标或定性与定量相结合的指标(混合指标)来评价信息内容的规模和质量，从信息资源的组织和内部链接结构两方面来考察信息的组织结构。与国内相比，国外更注重评价信息内容，甚至某些研究者专门研究信息内容评价，或用信息内容质量高低来衡量网站质量优劣。如：美国肯特州立大学的图书馆和媒体服务中心的网站评价问卷设计的权威性、客观性、准确性、时效性和可用性五大指标全都是用来评价网站信息内容。[11] 这表明，国外非常关心信息蕴含的内容，而对信息的外在形式(如组织结构和网站整体形象)关注较少，同时说明国外追求实质内容甚于表现形式。如果忽视外在形式与内容之间的相互联系，可能造成网站信息内容丰富完善，但网站美观、信息分类、网页链接等方面却不尽如人意，使得用户不愿意浏览该网站，并难以或无法找到所需信息。

(3)国内外基本上都把网站功能作为评价对象，包括导航功能(含检索功能)、增值功能(含信息咨询功能)和用户互动功能。如：王道林在可操作性指标下设导航设计的合理性指标、链接数量和速度以及检索功能指标。服务功能指标下设交互性、开放性和其他服务数量等指标。[12] Alastair Smith在可实用性指标下设用户界面友好性、检索功能、检索率、连通性等指标。[13] 可见，国内外都认为网站不能仅提供信息浏览服务，还应通过各种方式提高信息利用率和效果，帮助用户获取信息以及深度挖掘和利用信息，提高用户主动性，充分发挥网络媒介的交互优势。对网站功能的重视，说明研究者希望突出互联网的高科技优势，放大网络资源具有的快速、海量、增值性和交互性强的特点。

(4)在网站技术水平方面，国内外都以网站安全性、稳定性、软硬件设施为评价对象。此外，国内还提出应从网站速度、镜像数量以及镜像内容与网站内容的相符度等方面评价网站连通性能，如：贺婷婷设计的企业自主开发网站的评价指标体系在技术指标下设连通性能指标，而连通性能从网站速度、镜像数量以及镜像内容与网站内容的相符度这三方面来衡量。[14] 国外更强调对技术的合理使用，如：DESIRE计划(欧盟资助)的执行者设置了评价系统的过程指标，包括检测系统完整性，并指出系统管理者应对网站系统完整性负责。该文在形式指标下设技术使用的合理性指标，认为对网站技术的考察也是网站评价的一个方面。[15] 可见，虽然国内外都认为可以用网站技术水平来衡量网站质量，但国外更加理性，强调合理使用，不支持盲目追求高精尖技术，体现出实用主义思想。

(5)国内外都认为网站美工水平影响网站质量，通常从总体效果、字体、图片和多媒体三方面来评价。如：唐舸设计的出版社网站评价标准在形式指标下设整体结构指标、版式指标、字体指标、色彩指标和图像处理指标。[16] Alastair Smith设计的评价网络信息资源的一级指标包括图像和多媒体设计。[17] 这表明，国内外都认识到网站美工对用户的心理暗示作用，网页的排版、颜色和字体都能影响用户对网站的初始印象，还认识到图片和多媒体导致网站生动性和连通性之间产生矛盾关系，评价网站质量不仅局限在评价直接影响信息利用的因素，还包括其它间接影响对信息利用的因素。

(6)通过测算用户点击率、网络浏览量、被链接率和网络影响因子来定量评价网站效益，国内外都认识到这一点。但国内还将网站建设单位情况作为一项指标，如：王伟军设计的评价电子商务网站的经营业绩的指标包括网站流量、交易额、成本利润率和网站建设单位股票价格。[18] 国外则认为网络信息与其他载体相关信息对比情况同样反映网站效益情况，如：Hope N.Tillman[19] 和Joe Barker[20] 都认为网站信息与其他载体来源的相关信息的比较情况可作为评价网站质量的必备指标。可见，虽然网站一般不直接创造利润，但国内外都认识到可以通过一些相关数据来衡量网站效益(社会效益和经济效益)。国外还认为网络载体和其它载体的对比也是衡量网站效益的重要方面，这反映了国外比国内更重视定性评价，这与国外更重视定性研究方法相对应。

(7)国内外都认为，其他排名结果(如网站排行榜)可以作为评价网站的参考指标。陈雅和郑建明指出，网上著名站点对网站的评价结果，专家、学者的评价意见，搜索引擎的评价结果，专门统计软件的评价结果，网页访问计数器和其他重要传媒公布某时段的网站排名情况对网站评价都具参考价值。[21] Hope N.Tillman列举了一系列在线网络评价工具，如：常用的搜索引擎：Altavista、Fast、Google和HotBot' Lycos；搜索引擎伙伴：Ask Jeeves和Teoma；目录伙伴：Inktomi和Look Smart；一般性指南和目录：Argus Clearinghouse、WWW Virtual Library和Yahoo等。[22] 可见，国内外一些机构已经介入网站评价领域，从事实际的网站评价工作，国内外该领域研究者也重视利用他人的研究和实践成果，集思广益，博采众长。

3 网站评价研究的不足

3.1 国内外网站评价研究不足的共性

国内外研究者在网站评价领域花费了大量的时间、精力、财物，取得了可喜的成绩，极大地促进了该领域的发展，但也存在以下问题：

(1)评价对象有局限。评价对象的选择受到研究者语言的限制，很少对不熟悉语言的网站进行评价。评价对象主要集中在有限的几类网站，如图书馆网站、政府网站、教育网站、电子商务网站等，而对其它类型网站评价很少或没有。

(2)期刊分布过于集中。主要集中在图书情报档案类期刊，虽然有利于图书情报档案的研究，但不利于广泛汲取相关领域的知识，取长补短，也不易在该领域形成百家争鸣，百花齐放的研究氛围，难免形成研究思想单一，人云亦云，故步自封的状况。

(3)研究者地理分布不均衡。对网站评价的研究大多集中在经济比较发达、信息化程度较高、高校较多的地区，而经济水平和信息化程度较低的地区对该领域不太重视。实际上，网站评价研究及其成果可以促进网站质量的提高，帮助人们更好地利用信息，间接地促进经济增长和科技文化进步，欠发达地区对该领域研究的欠缺也会制约这些地区的发展。若经济鸿沟引发信息鸿沟，信息鸿沟进一步扩大经济鸿沟这一恶性循环不打破，信息马太效应的消极影响将会加剧。

(4)指标体系设计有缺陷。①指标体系不够完整和全面，评价指标只有反映网站的各方面、各层次的情况，才能对网站进行全面而完整的评价，而现有的评价指标体系往往只从一个或几个方面考察网站。②评价指标含义重复，某些评价指标的含义不清，针对性不强，指标设计的角度不明确，并且交叉重复，其结果很可能夸大网站的某些特性。③加权的主观性强，缺乏客观性，在现有的一些评价指标体系和方法中，权数的确定往往由指标体系的设定者主观给出，导致评价失去了客观性。

3.2 我国网站评价研究的不足

与国外相比，我国网站评价研究在立足点上忽视了从用户角度进行评价，评价的主客体不够明晰，缺乏实证研究，针对性和可操作性不强，主要体现在以下几个方面：

(1)选题的针对性和可操作性不强，比较注重对全体网站的整体评价，而有针对性的研究某类网站和具体网站较为欠缺，同时对评价方法的研究还不够。

(2)研究目的不够明确。主要从网站角度出发，希望通过对网站的评价，提高用户使用网站的便捷程度和网站的点击量，虽然这种立场无可厚非，但却忽略了用户自身评价网站优劣和识别信息真假的需要。在网站整体水平提高的前提下，用户仍然不知网站孰优孰劣，信息孰真孰假，既缺乏网站排行榜用以参考，也缺乏对网络资源的评价和识别能力，在海量信息中搜索和识别有用信息仍显被动。

(3)研究方法尚待完善。国内虽然也采用定性和定量的方法评价网站，但主要是定性和定量相结合的综合评价法，定性研究不够，设置的定量指标也缺乏明确的指标值获取方法。

(4)指标体系设计需改进。①评价的主体和客体不够明确。评价主体不同，评价的目的和角度也不同，所掌握的客体信息也有差别；由于开发者不同，网站的开发方式也不同，从而导致评价主体对网站的了解程度也不一样。②可操作性不强。评价指标体系是为了评价工作的开展而设计，但现在很多指标体系的部分或全部指标值无法获知，缺乏或没有可操作性，导致评价指标体系的实用性大打折扣。

(5)理论脱离实际。表现在实证研究匮乏，已发表的论文多为对国外情况的介绍以及评价理论与方法的一般描述，对网站进行实际评价的极少，设计和发放网站评价问卷进行用户调查的更是少之又少。总之，现有研究不够具体、系统和深入，缺乏实际操作。

4 几点建议

针对我国网站评价研究领域目前存在的问题，笔者提出以下建议：

(1)图书情报界和IT界除了应继续深入研究此课题外，还应广泛吸收其它学科领域的知识，改变目前研究角度和方法单一的状况。同时其它学术界也应当关注此研究课题，共同促进该领域研究的发展。

(2)经济欠发达、信息化程度不高地区的研究者，应提高对该领域研究重要性的认识，加大研究力度，加强当地网站建设，努力缩小信息鸿沟，促进当地经济发展，争取形成经济发展带动信息化建设，信息化建设促进经济发展的良性循环。

(3)在设计评价指标体系时，应注重指标体系的完整性、全面性和科学性，在注重内容评价的同时，不要轻视网站整体形象和美工等要素对用户获取和利用信息的作用。

(4)强调理论联系实际，提倡实证研究，重视研究的针对性和可操作性，将研究成果落到实处，用理论指导实践，在实践中检验和发展理论，避免纸上谈兵式的研究。

(5)树立以用户为中心的观念，注重从用户角度开展研究，通过培养和提高用户识别网络信息和评价网站质量的能力，促进网站建设和网络信息质量的改进。

(6)加强对研究方法的研究，弥补网站评价方法的不足。明确评价的主体和客体，强化定性方法，设置定量指标的指标值要具有可获取性。

国内外网站评价研究的比较与分析_定性指标论文

猜你喜欢