基于网站流量统计的网站可用性指标及计算方法研究,本文主要内容关键词为:可用性论文,网站论文,计算方法论文,流量统计论文,指标论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
修回日期:2011-07-09
1 引言
可用性(usability)是人机交互中的一个重要概念,它从最终用户的角度出发来评价产品质量的重要性。对网站来说,可用性反映网站是否符合用户的需求和期望,体现用户在使用网站过程中感受的网站价值,是网站成功的核心要素之一。可用性是通过用户的态度来反映的,而根据行为学原理,能够反映态度的正是行为变量,因而分析网站可用性要通过用户使用网站的行为和结果来评价。从此意义上讲,网站可用性分析是一个从用户出发,系统化收集用户的行为特征等可用性信息,运用一定的分析方法发现网站可用性问题并提出改进策略的过程。
在以往学者的研究中,对用户行为特征的分析往往借助于现场观察、调查问卷等手段,前者由于条件所限,只能选择有代表性的用户来分析,后者虽然可以开展大规模的调查,但属于一种事后自主报告的方式,用户出于心理顾虑,不愿意真实地披露内心想法。如何探求一种客观、科学、经济、高效的可用性分析方法成为可用性专家追求的目标。基于此,本文尝试根据用户和网站交互过程中记录在服务器或客户端上的访问数据来构建一套基于网站流量统计的网站可用性指标体系,并进一步探讨各指标的数据计算方法,从而为研究网站可用性提供一个新的思路和方案。
2 网站可用性分析研究现状
很多学者都认为可用性是度量一个系统或者网站成功与否的重要尺度之一[1],并从理论和实践两方面形成了诸多可借鉴的成果。从文献调研来看,国内外学者对网站可用性的研究都经历了从理论到实证,从通用网站到专业网站的发展历程,在继承和发展传统可用性研究成果的基础上,针对网站开展了大量的实证研究[2]。
著名可用性专家Nielsen根据多年对网站的研究总结了针对网络应用的特殊情况的4个新的可用性参数:导航、响应时间、可信度和内容[3]。Turner评估网站可用性的指标为导航、网页设计、内容、可存取性、多媒体使用、互动性和一致性[4]。Palmer的网站可用性指标为:下载延迟、导航、内容、互动性、响应性[5]。Tarafdar等人从信息内容、导航系统的易用性、下载速度、网站可访问性角度评估网站的可用性[6]。Rosen等人从一致性(友好的环境、易用的导航和清晰的设计)、复杂性(包含供用户探索的各种信息和图像)和易读性(一致和清楚的网站设计)三个维度定义可用性,实际上也是评估网站可用性的三个指标[7]。波多黎各大学计算机研究与发展中心的José A.Borges,Israel Morales和Néstor J.Rodriguez认为Nielsen提出的一些可用性测试方法需要用户参与,费时费力,在网页设计师的实际工作中是不切实可行的,因此采用启发式评估方法提出了适用于所有类型网站设计的10条简单的可用性设计指南以及针对主页的6条可用性设计指南,并且用实验证明了其有效性[8]。Venkatesh和Agarwal提出了MUG可用性准则为:内容、易用性、个性化及情感[9]。
国内学者也研究了网站可用性分析指标。如魏芳芳提出政府门户网站可用性用内容质量、易用性、网站推广、定制服务、情感因素来测度[10]。詹向阳提出的网络资源库的可用性指标包括内容、形式、个性化以及稳定性4类,每类下分别列举了若干细化的评价指标[11]。山东大学1篇硕士论文从网站设计的易用性、正确性、兼容性、网站性能4个方面分析了专业女性网站的可用性[12]。此外,针对电子商务网站、数字博物馆、高校图书馆网站、医学健康网站以及儿童网站的研究也分别提出了许多具体的可用性分析指标。
3 影响网站可用性分析的因素
网站作为一种新型的信息媒体,用户对它的使用不同于对普通工业产品的使用情形,大多数工业产品具有有限的任务集和可预测的用户,这些假设在面对网络系统时变得不成立,用户的个体差异、任务的具体特征以及所处的社会环境和物理环境都将直接影响用户的可用性感受。
3.1 用户
首先,网站用户数量是难以预估和控制的,网站对全球网民开放,但是有些网站只被小范围内用户访问,有的能得到全球瞩目;其次网站用户在地域、文化背景、语言、受教育程度、计算机经验、年龄、性别等方面是异质的。因而,在获取用户行为信息时,传统可用性研究中的用户分析方法往往对样本选择要求高,直接关系到可用性分析结果。
3.2 任务
用户使用网站的目的也不同,这归因于网站本身功能多样。面对用户任务的不同,用户对网站的需求也不一样,因而在网站可用性研究中除了遵循一些通用的可用性原则外,还应针对不同类型的网站开展针对性的分析。
3.3 环境
网站资源结构、网站技术平台以及客户端设备共同导致了用户使用网站时环境的复杂,实验室环境难以模拟真实的用户使用网络的情形,单靠传统的人工可用性分析方法难以胜任数据的采集、分析工作。此外,用户对网站的使用体验还受到周围社会环境如关键人群、价值观、文化习俗等方面的影响。
在笔者看来,这三者的影响导致网站可用性分析的复杂性和特殊性,而学界对网站可用性研究普遍存在一些惯性思维和弊端,因而并没有解决当前网站可用性的一些根本问题。最主要的根源在于学者在获取用户行为信息时采取的是传统的社会科学研究方法,如问卷调查和访谈、现场观察以及可用性测试等。用这类方法研究用户有一定的优势,其实施过程简单、灵活,获取的信息有针对性,但是这类源自社会科学实证研究的用户信息收集方法也都承袭了其原有的不足,特别是在样本来源广度和信息采集过程中研究者的介入程度两方面;其次,许多研究者为了比较用户使用网站的差异,通常会模拟任务情境,但毕竟不能代表用户的真实情况;第三,这些方法都是由人工实施的,很少有工具辅助自动完成,因而从时间效率、成本经济性来看不甚理想。
4 基于网站流量统计的网站可用性信息采集
4.1 网站流量统计采集可用性信息的优势
为了改进上述网站可用性研究的缺陷,适应网站可用性分析的要求,真实地反映用户与网站的交互过程,笔者提出应用网站流量统计方法来采集可用性信息。网站流量是网络营销研究中常提到的一个概念,泛指网站的访问量,可用一个网站一段时间内访问者的数量、访问者所浏览的网页的点击率和平均停留时间等指标来描述[2]。网站流量分析能获取用户与网站交互过程中自动保存在各服务器或客户端上的反映用户的访问来源、访问时间、访问内容、访问路径等数据,再由可用性分析人员将其转化为评估网站可用性的指标,从而能发现网站存在的可用性问题。
利用网站流量统计采集可用性信息具有以下优势:①用户分析样本得到改观。与传统可用性分析中用户测试方法相比,基于网站流量统计的可用性分析的数据来源是用户在与网站交互过程中自动记录在服务器或客户端上的数以万计的数据,在被测对象的数量、随机性、数据的准确性和充分性方面得到大大的改良,避免了实验中受空间、经费、技术等条件的限制,只能选择较容易获取的样本来分析的弊端,代之以时间为统计周期,随机获得网络上各种背景的用户信息。②在用户的真实任务环境中开展可用性分析。传统的现场测试、专家评估、认知走查等方法要求分析专家首先根据要测试的目的设计用户任务,并且设想用户执行正确的步骤是怎样的,然而这并非用户实际要完成的任务。而网络环境下用户任务是多样化的,难以被分析专家事先全面考虑到。③网站流量统计获得的信息具有数量特征,有利于进一步运用数理统计及数据挖掘方法发现用户行为的规律、模式和趋势。④不干扰用户。其他可用性信息采集方法是用户自主汇报或者由专家观察,专家的个人经验、用户的心理、关键人群的影响都会干扰用户表达自己的真实想法。网站流量统计分析是网站自动记录用户信息,对用户是透明的。
4.2 网站流量分析采集的可用性信息
基于网站流量分析的网站可用性研究就是在获得网站访问量基本数据的情况下,对其中影响网站可用性有关的数据进行统计、分析,发现用户的行为规律,并用以改进网站可用性的一种分析方法。网站流量分析从用户行为角度来评价网站的利用效率,揭示了网站与网站之间的量化关系、用户使用网站的方式以及用户的环境,对分析网站可用性具有重要的意义。从网站流量数据中反映网站可用性的信息主要分为以下几类:
第一类反映网站基本使用信息,如网站的独立用户数量、重复用户数量、网页浏览数量、每个用户的页面浏览数量、某个具体页面显示次数、文件下载次数、网站页面数量、网站内容更新情况等统计指标。
第二类反映网站的排名及口碑信息,如搜索引擎收录页面数量、外部链接数量、合作网站数量、媒体报导数量、PageRank值,Alexa排名、主要关键词自然排名等统计指标。
第三类反映网站的互动性信息,如注册用户数、在线反馈数量、在线人数等统计指标。
第四类反映用户使用网站的行为信息,如用户在网站停留时间、用户到达网站的入口方式和出口方式、用户所使用的搜索引擎及其关键词、用户在网站内的访问路径、用户出错情况等统计指标。
第五类反映用户的背景信息,如用户上网设备类型、用户浏览器的名称和版本、用户电脑分辨率显示模式、用户所使用的操作系统名称和版本、用户所在的地理区域分布状况等统计指标。
5 基于网站流量统计的网站可用性指标体系
5.1 网站可用性一级指标
5.1.1 网站规模 反映出网站自身的建设实力。通常用户对规模大、实力强的网站特别青睐,认为该网站能够满足其信息需求,愿意成为其忠实用户。
5.1.2 网站质量 又可分为内容质量和界面质量两个维度。网站的生存之道在于内容质量,内容高度重复和雷同乏味是一大隐患,网站之间的竞争迫使其纷纷采取措施,以内容战略为契机,提高用户对其网站价值的认同。此外,用户体验与网站界面的交互过程相关,一个友好美观的界面会给用户来带来良好的使用享受,增进人机交互的情感。如果说内容是一个网站的灵魂,那么网站界面则是网站灵魂的外在表现。界面质量也不单纯从美观角度来衡量,它更要考虑用户的使用环境、使用方式以及使用感受等。
5.1.3 网站推广 反映的是网站被外界的认同程度,从一个侧面表征了网站的可用性。常有的网站推广形式有被著名搜索引擎收录情况以及关键词排名、被其他网站链接情况、在某些网站流量统计和排名网站(如ALexa)中的排名情况以及PageRank值等。
5.1.4 网站辅助功能 指网站为帮助用户与网站进行更高效率的交互而采取的一些努力措施。例如网站的导航功能能减少用户迷航问题,快速找到目标;网站的个性化推荐功能能增进用户对网站的认同感和满意感,网站的帮助功能能及时解答在交互过程中出现的突发问题等。网站的这些辅助措施越到位,越能提高网站的可用性。
5.1.5 用户情感 指用户在与网站交互过程中建立起来的主观感受,如用户对网站的忠诚度、满意度、黏性等都是用户对网站的重要反应。用户来自不同的社会阶层,有着不同的文化和背景,将用户的情感作为评价网站可用性的核心指标,并以此来改善网站建设情况,提高用户对网站的使用效率是可用性专家主要的研究方向。美国可用性专家Donald Norman曾经出版著作《情感化设计》,强调如何将情感效果融入网站设计和评估中[13]。
5.2 网站可用性指标体系的操作化定义
用来分析网站可用性的5个指标只是较为抽象地反映出网站可用性的不同方面,需要将其转化为可观察的具体指标,这称为指标的操作化定义过程。操作化主要包括变量的定义及测量指标的开发两个方面。对变量进行定义就是对主要变量进行某种澄清和界定,以明确其表达的含义。测量指标是表示某一变量含义的一组可观察和辨认的事物,实际研究工作中,人们正是借助这些可观察和辨认的具体指标,来实现对抽象变量的定量化测量[14]。本文提出的网站可用性指标的操作化定义如表1所示。
6 网站可用性指标体系的数据采集与计算
表1中所给出的可用性分析指标和操作化定义大部分都以数值的形式存在,除了网站辅助功能A4下列的三个操作化定义需要用户根据网站实际情况定性分析外,其余数值形式的指标有的能借助网络流量统计和分析工具直接或者间接得到,有的需根据一定的数学公式推算。
6.1 网站规模的数据计算
网站规模用网页大小、网站页面浏览数、网站独立用户数量、网站在线人数具体指标来计算。一些常见的网站流量统计系统(如百度统计、谷歌统计)都提供了这些数据信息,可以直接查询。
6.1.1 网页大小 用网页的Kbytes来衡量,页面越大,反映网站的信息量越多,但也可能引起用户访问网站缓慢的问题,尤其是网页上包含大量的多媒体信息时。带宽技术的发展使得这一可用性问题的严重程度得到缓解,许多用户还是喜欢内容丰富的网页。
6.1.2 网站页面浏览数(Page Views,PV) 它是网站流量统计的主要指标之一,是在一定统计周期内所有访问者浏览的页面数量。但也有人指出,PV的可信度不高,例如一篇6 000字左右的文章可以都放在一个网页上,也可以分成5个页面,对于用户来说,获取同样的信息,前者网站统计报告中记录的页面浏览数是1,而后者网站则是5个,因而页面浏览指标对同一个网站进行评估有价值,而在不同网站之间比较时说服力大为降低。尽管如此,网站页面浏览数在一定取值区间内对可用性分析有参考价值,有学者发现如果这个数字太高,反而说明网站设计可能存在一定问题,指标过低(比如小于1.5),则说明网站受欢迎程度不高。
6.1.3 独立用户数量(unique visitors) 有时也称为独立IP数量,是网站流量统计分析中另一个重要数据,并且与网页浏览数分析之间有密切关系。独立访问者数量描述了网站访问者的总体状况,指在一定统计周期内访问网站的用户数量(例如每天、每月),每一个固定的访问者只代表一个唯一用户,无论他访问这个网站多少次,只能计为1个数量。独立用户数量比较真实地描述了网站访问者的实际数量,不仅能用于对同一个网站进行分析,而且可用于不同类型网站访问量的比较分析。该指标越高,说明绝对用户数量越多,网站的覆盖面越广。
6.1.4 网站在线人数 指访问网站的即时人数,通过这个指标能直观地了解网站能容纳的接入数量,体现出诸如网站的带宽容量、服务能力等物理性能。
6.2 网站质量信息分析
6.2.1 网站更新频率 一般是指单位时间内承载发布信息的网页产生(即网站中新页面的出现)或变更的速度。网站更新频率越高,意味着内容越丰富,在同行网站之中的权威性就越高,在一定程度上也影响网站的排名,因为搜索引擎爬虫软件总是对具有合适更新频率的网站特别青睐。在影响网站可用性的研究中发现,具有规律性的更新频率的网站是优化的主要目标。
6.2.2 网站响应时间 指用户对站点或服务器发送请求后得到返回结果的这段时长,包括从DNS解析、与网站服务器建立网络连接、网站服务器处理到下载网页内容等多个环节。网站响应时间越低,反映网站性能越高。
6.2.3 网站出错率 反映网站的稳健性,可通过对Web错误日志文件分析得到。错误日志文件包含自创建该日志文件以来Web使用过程中遇到的错误,如URL无法找到、用户登录错误、文件记录缺少、系统无法响应等异常情形。常用的Web Server如Apache、MSIIS等在返回的日志记录中有一个状态代码指明了本次访问是否成功,以2开头表示成功,以3开头表示用户请求被重置,以4开头表示客户端存在某种错误,以5开头表示服务器遇到错误。统计日志中状态代码为3、4、5的访问次数来计算网站的出错率。
6.2.4 网站无效链接数 反映网站链接结构的设计质量以及网站本身的严谨性。导致链接失效的原因很多,如动态链接在数据库不再支持或坏死情况下失效,原来的某个网页或文件移动了位置、网页内容更新换成新链接以及网站服务器设置错误、域名解析错误、DNS被攻击记录被删除等。当无效链接数超过一定阈值,说明网站在链接质量方面存在一定问题,需要及时改进。可以通过一些无效链接检查工具如Web link validator来分析网站的链接质量。
6.3 网站推广信息的分析
网站推广指的是网站被第三方网络或者媒体(如搜索引擎、合作网络)收录、交换、宣传、报导,从而增加其影响力。网站推广的目的在于让尽可能多的潜在用户了解并访问网站,通过网站获得有关产品和服务等信息,为最终形成购买决策提供支持。衡量网站推广程度的指标有:
6.3.1 网站被著名搜索引擎收录网页数量 可通过用搜索引擎的site命令获得数据。如果一个网站的网页被Google、百度这样的搜索引擎收录次数越多,越会增加用户发现该网站的机会。
6.3.2 网站重要关键字在搜索引擎中的自然排名 也可通过搜索引擎提供的一些工具来获得,如百度指数、Google Analytics。某网站的主要关键字在搜索引擎排名中越靠前,用户就越容易发现它,从而访问该网站。
6.3.3 网站Alexa排名 是目前常引用的用来评价网站的一个指标。Alexa是一个专门发布网站世界排名信息的网站(http://www.alexa.com),每天在网上搜集超过1 000GB的信息,不仅给出多达几十亿的网址链接,而且对其中的每一个网站进行排名,在网站评价方面具有一定的权威性。
6.3.4 网站PageRank值 是Google中表示网页重要性的一个综合指标,由于该值的核心是基于对“使用复杂的PageRank算法而得到的链接构造”的分析计算而来,PageRank认为网页的重要程度与其所链接和被链接的程度相关[15],改变以往单纯的用反向链接数来评价页面重要性的做法,考虑到反向链接的权威性,因而能更好地的反映网站与网站之间的关系。
6.3.5 网站链接广泛度 这一概念来源于HITS搜索引擎排名算法的研究。HITS算法用权威度(authority)和链接度(hub)来评估网站[16],根据这些研究,笔者提出用网站的链接广泛度这一指标来作为衡量网站质量的一个因素,它指网站被外部链接的总数量,即外部链接数。常见的搜索引擎如Google、Altavista & Infoseek等都能直接查询到某一网站的链接广泛度,有的还有去除站内链接的功能。
6.4 用户情感信息的分析
在网站可用性研究中,用户情感是一个重要的可用性分析指标。本文的指标体系吸收了这一成果,将其用以下指标来衡量。
6.4.1 用户对网站黏性 用每个用户的页面浏览数来计算,它是在一定时间内全部页面浏览数与所有用户数相除的结果,即平均每个用户浏览的页面数。这一数据表明了用户对网站内容或者服务产品感兴趣的程度。
6.4.2 回访者比率 反映网站的首次用户对网站因为认同而再次回到网站,这种认同是由于用户在第一次访问中获得良好的体验而产生愉悦之感,因而期望着再次访问网站。计算公式为:回访者数/独立访问者数。
6.4.3 访问者参与指数 是一个和回访者比率有关系的指标,同样也表征网站吸引用户再次访问的能力。计算公式为:总访问数/独立访问者数,也即每个访问者的平均会话数。对一个非常适应目标受众的网站,该指数将大大高于1,如果网站不满足大部分访者的需求,几乎每个访问者都建立一个新的会话(session),该指数将趋近于1。
6.4.4 积极访问者比率 反映用户对网站内容或服务的欢迎程度,如果网站适应用户的任务需求并且使用方便,用户会多次地、深入地访问网站,从而表现出一种积极的情感。这个指标也是网站运营分析指标之一,计算公式为:访问超过一定页数的用户数/总的访问数。
6.4.5 忠实访问者比率 与积极访问者比率相似,只是使用停留的时间取代访问页数,其计算方法为:访问超过一定时长的用户数/总用户数。这两个指标在一定程度上结合可以反映出用户对网站的忠诚度。
7 讨论及研究展望
相比其他学者提出的网站可用性指标,本文提出的可用性指标的特色为:①是完全基于用户与网站交互过程中的客观信息构建的一套指标,因而能客观地反映出网站存在的可用性问题;②是对用户不干扰的一种可用性分析方法,不需要邀请用户到可用性实验室来测试,也不需要用户填写调查问卷;③是具有量化特征的一种可用性分析方法,许多指标都有详实的数据来计算,克服了用户定性的描述主观态度的不足。从理论上分析,该方法具有经济、可行、量化、客观的优点。
限于篇幅,笔者在本文中初步提出了一种网站可用性分析新思路,有许多问题仍值得进一步探讨。首先要开展的研究是根据本文的思想,选择具体的网站开展可用性分析实验,从实践角度验证本文所提出的方法的可行性;其次,笔者也意识到可用性分析既需要融入人的主观因素来判断,也需要客观、定量的数据支撑,没有任何一种可用性分析方法能够非常完美地发现网站的可用性问题。因而在实际应用中,本文提出的新方法可以作为一些经典的可用性分析方法的有力辅助,但是对于不同的可用性分析方法得到的结果如何处理也值得去思考。在后续研究中,笔者将继续在完善指标体系的基础上,将本文的研究成果和传统可用性分析结合起来开展实证研究,从而发现网站可用性问题,达到优化网站设计、提高网站信息资源利用效率以及增加网站收益的目的。
标签:可用性论文; 流量统计论文; 用户研究论文; 可用性测试论文; 网站统计论文; 用户分析论文; 网站分析论文; 访问者模式论文;