信息构建评价初析,本文主要内容关键词为:评价论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
信息构建(Information Architecture,IA)是在1975年由美国当时的建筑师协会主席Richard Saul Wurman首次提出的,他将IA 准则表述为“使信息可被理解”和“按表达预定意图的方式传递信息”,这恰好也是情报学要解决的核心问题。IA实践具有较强的“用户导向”(User-oriented)色彩,使万维网信息生态系统中的业务环境和用户要素与内容要素并重,避免网站建设继续淹没在一系列技术手段中。
尽管越来越多的组织开始投入大量资源设计网站IA,可是在网站付诸使用后,特别是在网站运转状况良好的情况下,大多数组织都忽视了对其进行评价。然而,存在缺陷的IA严重影响到网站的整体功能和效益。因此本文讨论网站IA定性与定量相结合的评价,以期能够对网站IA评价方法的形成起到引导作用,同时也进一步深化基于网络的IA研究,并且为未来的网站建设提供最佳实践。
1 信息构建的特征与结构
信息构建是信息系统内组织、导航、标识和搜索体系设计的总和。它诞生在情报学与建筑学的结合点上,借鉴建筑学的成熟理念,应用情报学的原理和方法,旨在帮助人们有效地管理信息以及快速地查找信息。虽然这一概念的先进性得到了公认,但是在首次提出后的二十年时间里一直没有遇到能够充分体现其价值的适用领域,直至20世纪90年代中后期,网络的迅速成长唤醒了人们对IA的重视:当各种技术手段面对万维网种类繁多、内容特征多样、存储分散无序的多媒体信息束手无策时,基于万维网环境的IA逐步成为设计大型网站的蓝图[1]。
网站IA是依托万维网信息生态(Information Ecology)系统发挥作用的。从生态角度考察人与信息资源之间的关系是建筑学对IA的重大贡献之一,这种新视角打破了传统的“技术至上”倾向,强调了万维网信息生态的三个要素——环境(Context)、用户(User)和内容(Content),在本质上它们是具有适应性和复杂性的信息生态系统内相互依存的三个属性。网站是信息内容的载体,IA能够帮助网站在适应不同类型用户的信息需求和行为的同时,也反映出信息产生环境的业务模式、目标、政策、文化以及资源状况,从而取得万维网信息生态的平衡[2]。
信息构建师(Information Architect,IA)是信息构建活动的主体,他们的职责在于:使网站的使命和远景明晰化,平衡来自组织和用户两方面的需求;确定网站的内容和功能;通过定义网站的组织、导航、标识和搜索系统阐明用户将如何在网站中寻找信息;制订网站适应未来变化和升级的方案。信息构建师肩负着网站整体规划的任务,是贯穿于整个网站建设过程的灵魂人物,他们的工作对于实现站点业务目标、提高用户服务效率、控制网站设计开发成本、延长网站生命周期具有重大意义[2]。
网站IA的核心内容是组织系统(Organization Systems)、导航系统(Navigation Systems)、标识系统(Labeling Systems)和搜索系统(Search Systems)这四个主要组件,它们相互关联、相互影响,作为一个整体共同决定着网站有效性(Website Effectiveness)。对于网站用户来说,长期以来IA都处于半隐匿的状态,一方面是因为IA是一个抽象的概念,即使是对概念本身有所了解的用户也很难区分出各个组件,一般的用户甚至可能意识不到IA的存在;而另一方面,他们已经习惯于利用站点地图、搜索框、图形标志等工具在网站中定位信息,这些位于交互界面上看似独立的元素实际上都各自隶属于IA的主体组件[1]。
组织系统是决定网站IA成功与否的关键因素,也是建立导航系统和标识系统的基础,它由信息组织方案(Organization Schemes)和组织结构(Organization Structures)两部分组成。组织方案定义的是信息内容的共性,直接影响到信息的逻辑分组;组织结构表现的则是这些分组之间的关系类型。与层级结构相对的是由下至上的关系数据库模型(Bottom-Up Database Model),数据库的设计则要深入到繁杂的内容层面,其中每条记录都必须有相同的属性,属性内容又必须按照相同格式存储,这对拥有大量异质信息的万维网站点来说是一种限制[3]。
导航系统不断为用户提供路径线索和标志,使他们始终知道自己“在哪里”,这一点在超文本链接过程中至关重要。常见的导航系统有全局导航系统(Global Navigation Systems)和局部导航系统(Local Navigation Systems)。前者是整个站点范围内的导航系统,可能出现在所有的页面上,至少应该出现在所有的导航页面上,无论用户处于网站层级结构的什么位置,他们都可以随时通过全局导航条直接进入一些关键或常用的页面[4];后者通常是限制于某一个子站点(Sub Site)范围内的导航系统,子站点是网站中相关网页的集合,这些网页不仅涉及共同的主题,表现出相同的设计风格,而且一律遵循特有的导航机制[5],大型网站各个子站点的局部导航系统会依据子站点内容和面向用户的差异而有所不同。
2 信息构建评价的指标描述
2.1 信息构建评价的意义及困难
网站IA所创造的价值很难以货币衡量,但是我们可以通过IA缺陷造成的损失来评价它:
●找不到信息的损失:用户找不到所需信息时的挫折感、因无法获得信息而作出错误决策的经济损失、原有用户的流失、潜在用户拒绝加入、为了挽回用户信心而向其提供替代服务的开支。
●查找信息的损失:查找信息耗费的时间和点击鼠标的次数、用户颇费周折才找到所需信息时的挫折感、所得信息与目标信息偏离的程度。
●内容管理的损失:因无法加入新内容或剔除过时内容而造成的开支、因达不到用户的可用性标准或无法升级而重建网站的开支[2]。
实际上,由于万维网信息环境瞬息万变,即使是优秀的网站也会随着时间的推移而逐渐出现漏洞,因而几乎所有的网站都必须经历重建,甚至是不断的重建[1]。有调查估计,全球1000强企业平均每年投入150至210万美元用于企业站点的重建,可是它们却并不清楚重建是否真的能够提高网站的易用性。由此可见,在重建网站前开展IA评价是一个不可缺少的环节,这项活动不仅有利于判断重建的必要性,而且可以帮助信息构建师识别需要改进的方面[6]。
评价是指系统而客观地评估正在进行中的或已经完成的项目、计划或策略,包括其设计、实施和结果。评价的目的是确定目标的相关性和实现情况、效率、效果、影响和可持续性。评价应该提供可靠、有用的信息,帮助人们作出正确的决策。在某些情况下,评价涉及到制定适当标准,根据这些标准考核绩效,并且测定已取得的成果和预期成果,识别经验教训[7]。从该定义可以看出:首先, 评价是一个针对评价对象的判断过程;然后,评价是一个依托于特定准则和方法的系统过程;最后,评价是一个反映实际情况、提供决策依据的复杂过程。简而言之,评价是评价主体根据一定的评价目的和参照系统对评价客体的价值进行认识的评定活动[8]。评价的机理在本质上就是搜集、分析与评价对象有关的信息。
IA不同于一般的评价对象或客体,它不是一个实体,而是网站这个实体的蓝图,用户对IA的感知是“体验”到的,却无法通过观察或触摸得到,这为IA的评价设置了无形的障碍。Steve Toub也认为,证明IA是推动站点进步、影响网站有效性的直接因素是非常困难的[6]。
当网站用户和所有者均达到了各自的目标时,我们可以认为该网站是有效的[1]。有效性也是对万维网信息生态平衡的另一种表述。从以往的发展来看,网站所有者建立网站是为了向用户提供信息、产品或服务,并最终从中获得利益,譬如经济利润或声誉的提高;而用户访问网站正是希望获得这些信息、产品或服务。有调查显示,40%的用户会因为第一次访问网站不顺利而不再回来[7]。由此可见,网站对于用户有效是对于所有者有效的前提,网站有效性(Website Effectiveness)与用户满意度直接相关,如果用户无法或者无法完全基于某个网站完成其任务,那么这样的站点就是无效或低效的[8]。然而,这种情况究竟是由哪些不足之处造成的呢?在人们发现大约有2/3的用户访问网站目的在于查找特定信息[9] 之后,往往倾向于将网站的有效性低于归咎于信息构建中的缺陷,认为设计者更加注重站点的“外观和感受”,而忽视了IA对用户选择路径能力的影响[10]。在IA研究发展的现阶段,理论与技术的不成熟使得我们很难证明这种观点是正确的,反之亦然。
2.2 信息构建评价的指标
IA是网站建设的蓝图,它是网站投入运行的必要条件,但并非充分条件。很多用户也许都拥有这样的经历——进入网站仅仅几秒钟时间,还未点击任何链接就离开了。这可能是因为:(1)网页下载的速度太慢;(2)页面的设计风格没有吸引力;(3)用户发现网站的内容与自己的预期不符[11]。诸如此类不属于IA 范畴而又确实能够影响用户访问行为的因素还有很多。英国管理中心国际有限公司(Management Centre International Ltd.)发布了一份网站有效性评价对照表(Website Effectiveness Review Checklist),下表抽取了其中一些适用于各类网站的典型评估指标,从而能够更加清晰地说明有哪些因素可能对网站有效性产生影响。
网站有效性评估对照表(部分)
(http://www.mcil.co.uk/review/7-site-review-checklist.xls)
1.FIRST IMPRESSIONS 1.第一印象
URL 网址
Download time-size of home page 下载时间——主页大小
Look and feel-readability外观和感受——可读性
Need to download software需要下载其他软件才能浏览网站
Home page on one screen(above the fold) 主页在一屏内显示
Feeling of wanting more-depth of site站点深度
Contact details 详细联系信息
Credential validation资格验证
Statement from management管理声明
Are you made to register to get into site?
注册后才能进入站点?
2.NAVIGATION 2.导航
Ease of use 使用的容易程度
Site map 站点地图
Return to Home Page from any page任何页面都有返回主页的链接
Internal search engine
站内搜索引擎
Internal links
内部链接
Broken links 损坏的链接
Text as well as graphic links(ALT tags) 用文字与图标标示链接(ALT文字说明)
Navigational links visible
明显的导航链接
Opens multiple windows
可以打开多个窗口
3.CONTENT3.内容
Useful information
信息的有用性
Degree of substantiated information 信息内容经过证实的程度
Level of interaction 交互的程度
Use of valuable graphics 图片的使用
Use of valuable animation动画的使用
Use of valuable sound声音的使用
Content in digestible quantity
可接受的信息量
Up-to-dateness
内容的更新
Terms and conditions 条款细则
FAQ's常见问题
4.ATTRACTORS 4.吸引性信息
Invitation to register for something 注册邀请
Special offers
特殊优待
Freebies 免费赠品
Breaking news爆炸新闻
External links
外部链接
Newsletter
时事通讯
5.FINDABILITY5.可查找性
Intuitive URL直观的网址
Designed for search engine performance
提高搜索引擎性能
Intuitive keywords
易懂的关键词
Use of metatags 元标签的使用
Use of frame 框架的使用
Partner and affiliate sites 合作站点和附属站点
6.MAKING CONTACT 6.联系
Email and other details visible 明显的Email及其他联系方式
Response time to enquiries
对询问的回复时间
Automatic email response 自动邮件回复
Personal email response 个人邮件回复
Use of online forms 在线表格的使用
Telephone contact number provided提供联系电话号码
7.BROWSER COMPATIBILITY 7.浏览器的兼容性
Internet Explorer(1—5) Internet Explorer(1—5)
Netscape Navigator(1—4) Netscape Navigator(1—4)
Mac Mac
8.KNOWLEDGE OF USERS 8.用户的知识
Availability of utilisation statistics
提供网站使用统计数据
Adaptive website 适应性网站
9.USER SATISFACTION 9.用户满意度
Robustness/reliability of the site
站点的健康度和可靠性
Clicks to completion 通过点击完成任务
Acknowledge order/request请求确认
Order/request tracking online在线追踪请求
Retain personal information to minimise
detail entering 保存个人信息以减少输入
10.OTHER USEFUL INFORMATION 10.其他有用的信息
History of the company
网站所有者历史
Management structure of company 网站所有者(组织)的管理结构
Mission statement使命陈述
下页表中所列出的评价指标既有IA元素,也有非IA元素(除IA元素外的所有其他影响因素),而且只是可能影响网站有效性的一部分因素,这种复杂性给我们证明IA对站点有效性具有直接作用带来了巨大的困难。如果采取定性的方法,似乎只能对IA不同而其他方面完全相同的两个大型站点进行严格比较。即使这样做在资金和技术上是可行的并且获得了成功,可是得到的结论也不一定具有一般性,因为不同类型网站所有者的目标与特点不同,网站面向的用户和包含的内容也各异。如果采取多元回归分析的定量方法,可以将网站的IA指标和非IA指标均看作自变量,而将网站有效性看作因变量,在已知这些变量值的前提下可以构造出回归方程,然后进行回归参数的显著性检验,即检验IA指标变量对因变量的作用是否显著。然而从网站IA的核心内容可以看出,IA指标是不容易量化的,也就是说很难得到IA指标变量的值。此外,这里的自变量与因变量是线性相关还是非线性相关也无法确定。
3 信息构建评价的方法
3.1 信息构建的可评价性
幸运的是,我们可以通过一些可靠的数据来源(如Alexa、Google等)获取非IA指标的数值和能够反映网站有效性的指标的数值。假设A、B两个网站的各项非IA指标的数值分别非常接近,在仅考虑这类指标的前提下应该认为A和B是类似的,可是在比较反映网站有效性的指标的数值时,A和B却又具有较大差别。由于非IA元素和IA元素的总和是影响网站有效性的全部因素,所以基于上述假设,即在前者没有区别的情况下,给这两个网站的有效性带来区别的肯定是IA元素,且它们的IA表现出了不一样的效果。同样,当我们把网站的数量增加到几个甚至几十个时,可以分别依据以上两类指标对这些网站进行分类。若IA元素对网站有效性的作用甚微,即只有非IA元素影响网站的有效性,则两次分类的结果应该基本一致;若两次分类的结果迥然不同,则能够更有效地证明IA元素对网站有效性的影响,而且,两次分类结果的出入越大表明IA元素的影响力越大。
“可评价性”(Evaluability)是评价活动中的关键术语,它是指在多大程度上能够用可靠且可信的方式对活动或计划进行评价。关于可评价性的判断,要求提早考察拟评价的对象,以弄清其目标定义是否完备、其结果是否可以证实[6]。评价的作用可以抽象为回答了以下两个问题:(1)“做得怎么样”?(“How well did we do?”);(2)“做了多少?”(“How much did we do?”)。 这两个问题的答案分别是通过定性评价(Qualitative Evaluation)和定量评价(Quantitative Evaluation)得到的[12]。
2001年,信息构建领域就IA的可评价性问题召开了一次小型座谈会,主要讨论是否能够以定性或定量的方式评价IA[13]。
Marti Hearst相信IA(的大多数方面)是可以量化的,不过前提是开发出新的工具,他的研究团队正致力于此。他认为这些工具必须通过用户测试,而且只应看作其他方法的补充。
Shiraz Cupala表示,如果IA能够改善可用性和用户体验,那么这种改善就一定可以量度。当人们评价两个不同的IA时,他们是利用自己的眼睛、依据某些自认为重要的标准来进行评价的。Cupala声称评价可以量化到驱动IA发生作用的要素或特点的层次,而且它们必须得到量化,这样才能形成IA绩效的全局图。
Gary Marchionini对IA的标准化全面评测持怀疑态度,他认为自己评测数字图书馆的多面纵向方法也适用于IA评价,在定量指标(如日志分析的结果)和定性指标(如通过访谈和问卷得到的用户报告)间进行三角测量可以得到关于IA有效性的可靠结论。
Nick Ragouzis则主张放弃定量评价,他将科学(尤其是社会科学)的发展归功于理论与应用中的创新和偶然发现以及终极价值的传递,而定量评价只处于服从地位。
Jesse James Garrett也不赞成对IA进行量化评价。他指出, 技术环境中出现的问题绝不是只能通过技术途径解决,只有人类的智慧才能够避免将用户引向那些出于善意却设计不周全的“捷径”。
从以上专家的观点可以看出,IA是能够以定性方式评价的,但是究竟能否以定量方式评价还是一个悬而未决的问题。以下本文将探讨以定性和定量相结合的方法评价IA的可能性。
3.2 信息构建评价方法——可用性测试
在IA研究兴起的初期,人们常常将“Information Architecture”和“Usability”这两个术语互换使用。然而实际上,IA与可用性之间不仅仅只存在语义学上的差别,它们是两个拥有不同范围和侧重点的独立研究领域[14]。
正如本文第一部分所述,IA涉及信息系统的组织、导航、标识和搜索,在万维网环境中,它是基于环境、用户和内容这三个信息生态要素帮助人们有效管理信息、快速查找信息的。而可用性强调的是系统与其用户之间的关系,研究的是用户使用系统的能力,一个高效的系统应该为用户完成其任务提供最大的可能性[15]。
对于网站这样的系统来说,IA问题通常在可用性问题中占据了相当大的比例。可用性是一个非常细致的领域,它将字体大小、颜色、视觉效果、站点结构、搜索、出错信息、导航、表格设计以及标识等诸多方面都考虑在内。显然,IA的核心内容都被囊括其中了。因此,当我们无法诉诸于现成的科学方法评价IA时,可以借鉴发展更为成熟的可用性领域中的评价方法,而且这样做一般都是可行的。
利用可用性测试方法评价IA应该遵循一定的方式。首先,我们可以直接采用权威的可用性测试技术,但是对其加以适当的改进以应用于IA评价。该原则要求我们对可用性测试的内容进行增删,从而尽可能与IA评价的对象属性达成一致。其次也可以邀请可用性专家参与评价活动,与他们一起评价网站的所有方面,并且确保IA评价是包含在整个评价中的。
系统可用性测试的方法主要有四种:基于分析技术的正式评价、基于计算机控制过程的自动评价、基于用户测试的实证评价以及基于一定判断标准的启发式评价[16]。从以上对IA的定量可评价性的讨论可知,正式的IA分析模型尚未到达可以应用于实际软件开发的阶段;而自动评价方法在其可靠性经过大量检验之前几乎是无法实行的。因此,以网站可用性为背景的IA在评价方法上只能依赖于用户测试与启发式评价。
用户测试(User Testing)是发现可用性问题的重要方法,与启发式评价相比,它更加为人们所熟悉。简单地说,用户测试是从真正使用系统的用户那里搜集数据评价系统界面的一系列方法。小规模的用户测试一般有4到10位参与者, 每个人都带着(指定的)任务使用系统,观察人员在一旁记录下他们在使用过程中遇到的困难。通常,用户测试鼓励参与者在使用系统的同时大声地“想”出来,也就是将自己的思想活动大声地说出来,从而帮助观察人员了解用户对系统问题的看法以及他们对界面改进的建议。随着测试规模的增大,参与用户需要更加具有代表性、尝试完成各类任务,测试环境的控制越发趋近于自然,测量工具也更加精密(如录音录像器材、监测软件等)。有必要的话,还可以将用户测试与其他数据搜集方法结合起来,如问卷、访谈等等[17]。如果多个用户在测试中都遇到了同样的难题,那么系统的这个方面就是最需要研究、改善的。用户测试常常可以揭露特殊、细微的问题[18]。
启发式评价(Heuristic Evaluation)是可用性观察(Usability Inspection)的一种形式[19]。1990年,Jakob Nielsen和Rolf Molich提出了启发式评价方法,其基本思想是评价者(Evaluators)根据一套相对简单而全面的启发式准则(Heuristics)发现系统的可用性问题[20]。启发式评价并不是一种纯粹的分析方法,我们可以将其看成是“一组分析人员利用多个可靠的模型进行分析”的过程。这一过程涉及到两个重要的方面:首先,有一组评价者而不仅仅是一个人参与了该过程,他们并不一定来自于用户群体,他们对系统的评价是分别开展、互不干扰的;其次,该过程是以一套对可用性设计具有启发意义的准则为导向的,而与之类似的专家评价(Expert Evaluation)却没有使用这样的准则。最初的启发式准则共有九项:简明而自然的设计、以用户的语言说话、使用户的记忆负担最小化、保持一致性、提供反馈、提供标记明显的出口、提供快捷方式、提供明了的出错信息、防止出错。启发式评价方法在网站开发领域颇为流行,因为它对资金、时间和专业知识技能方面资源的要求不高,通常能够以较低的成本快速地形成反馈,而且人们普遍认为得到的反馈是正确、有用的。不过采用该方法只能找出系统中存在问题的方面,却识别不出“做得好”的方面。
我们在一项研究中评价大学网站IA时,综合运用了用户测试方法和启发式评价方法(另文讨论)。启发式评价方法的效率非常高,在计划周详的情况下最多可以发现81%至90%的可用性问题;而一个没有经验的评价者也可以发现22%至29%的可用性问题[21]。然而,这些可用性问题大多局限于显而易见的方面,例如信息的组织与安排、术语的前后一致以及交互机制的连贯性[19]。在Nielsen的一项研究中,启发式评价找到了42%的“大”问题和32%的“小”问题(问题的“大小”是以其重要性来评判的)。因此,启发式评价在细节问题上的弱点需要通过用户测试来补足。尽管利用这两种方法得到的结果在某种程度上有所重合,但总体上还是两类存在显著差异的可用性问题。该项研究首先对用户测试方法和启发式评价方法作了一定的调整,使其更加贴合IA评价的需要。然后对大学网站完成了启发式评价,在“节约人员”的前提下尽可能清除了“明显的”IA问题,最后在用户测试中总结出许多容易被人忽略的问题。值得一提的是,“人员”对于此类研究来说确实是十分宝贵的资源,大多数情况下都很难在短时间内预约到大量的参与者。
标签:可用性论文; ia论文; 用户研究论文; 可用性测试论文; 系统评价论文; 网站测试论文; 启发式方法论文; 测试过程论文;