数字图书馆可用性评估模型研究_数字图书馆论文

数字图书馆可用性评价模式研究，本文主要内容关键词为：可用性论文,数字图书馆论文,评价论文,模式论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1 引言

可用性作为人机交互系统追求的一个重要目标，取决于工具、用户、任务和环境四个要素之间的动态作用[1]，具体到数字图书馆这一人机交互系统的可用性，四个要素中的工具是指数字图书馆；用户是指处于不同年龄、性别、种族、语言、知识、经验、职业、生理状况、培训经历、教育程度和文化背景等特征下的用户；任务是指用户为了实现信息需求而与数字图书馆的交互所执行的不同类型、不同阶段、不同情境下的任务；环境是指用户利用数字图书馆执行任务所处的技术、物理、气候和社会文化等环境。

图1 数字图书馆可用性评价与相关学科的关系

数字图书馆可用性评价是指通过特定用户在特定环境下利用数字图书馆执行特定任务以评价数字图书馆的可用性，涉及的学科领域十分广泛，大致包括硬件设计、软件工程、人体工效学、信息科学、美学、心理学、行为科学、认知科学、人类学、社会学、经济学、数学等学科领域(见图1)。据不同的评价目的、视角、理论和方法，数字图书馆可用性评价可以有以系统为中心的模式、以任务为中心的模式、以用户为中心的模式、审美模式、人类学模式、社会学模式、经济学模式等多种模式，下面着重介绍和总结前5种常见模式及其实证研究的案例。

2 数字图书馆可用性评价的常见模式

2.1 以系统为中心的模式

以系统为中心的模式一直以来都是数字图书馆可用性评价中最常采用的一种模式。早期的以系统为中心的模式体现了人机交互研究中“以机器为中心”、“以技术为本”的思想，依据行为主义心理学理论进行用户研究，认为用户是被动的，外界刺激是主动的，用户经过严格的训练后都可以适应机器操作的要求[2]。目前以系统为中心的模式越来越注意引入动机心理学和认知心理学研究的成果，逐渐提高评价过程中用户的参与程度，但主要关注的仍是数字图书馆的技术和信息内容，评价重点是系统的性能如查全率、查准率、相关性、响应时间等指标，评价结果能为数字图书馆开发和研究提供最直接的依据。按照Saracevic的观点，以系统为中心的模式包括内容、处理和工程三个部分，其中内容部分涉及数字图书馆馆藏的选择、组织、存贮和服务等方面，处理部分涉及系统完成特定任务的过程、技术、算法、操作等方面，工程部分涉及硬件、软件、网络及相关配置等方面[3]。Fuhr等则把这一类评价分为“网下”评价和“网上”评价，前者是指通过用户执行特定任务来评价系统；后者是指数字图书馆在互联网上的分布式存取和计算的评价问题[4]。以系统为中心的可用性评价具有如下特点：评价的目的在于发现系统存在的可用性问题，主要是数字图书馆的性能、内容、技术等方面；评价标准或测试任务由开发者、可用性专家或数字图书馆工作人员制定；评价过程中较少强调用户的参与作用。主要缺陷是：评价指标根据国际标准或可用性专家的理解来设定，存在简单化、抽象化的弊病；在评价过程中起主导作用的是开发者、可用性专家或数字图书馆工作人员，用户的参与程度不高；被测者执行任务后要把操作体验转化成相应的答案，在这过程中存在理解的偏差。

案例英国健康服务数字图书馆网络开发的临床决策门户具有支持循证决策、循证实践和循证教育的功能，为了探讨数字图书馆可用性和有用性的关系，Buchanan等以临床决策门户为例同时评价其可用性和有用性，其中可用性包括有效性、效率、界面美观、易学、易导航、术语易理解六个特性；有用性包括相关性、可靠性、充分性三个特性。评价分为两部分：①采用计算机系统可用性问卷法设18个问题调查了29个临床医生。被测者总体感觉满意，但对系统的效率、术语、导航、相关性的满意度不够高。对此，Buchanan等提出改进措施，建议利用色块方便交互、提供联机指南、简化登录程序、按相关性排列检索结果、提高工作人员的认识。②采用现场观察法观察4个临床医生完成特定任务的情况。发现系统在登录、导航、术语、构建检索式和检索结果相关性方面存在问题。建议简化登录程序、列出检索样例、提高容错性能、提供精简检索结果功能。以上评价表明，数字图书馆的可用性和有用性相互联系并决定着用户使用的满意度，这两个方面在数字图书馆评价中应一同考虑[5]。

2.2 以任务为中心的模式

以任务为中心的模式根据不同的评价目的，设计不同类型、不同阶段、不同情境下的任务，通过测试用户执行任务的情况，掌握用户的信息需求和信息行为，发现用户与数字图书馆交互中存在的问题，把握系统对任务的支持情况，在数字图书馆评价中的可用性测试就属于以任务为中心的评价模式。以任务为中心的模式在数字图书馆开发中早有应用，例如，为了实现数字图书馆间的无缝连接，Cousins在1996年就提出要以任务为导向进行数字图书馆界面设计的观点，并为此开发出连接异构数字图书馆的界面原型InforBus[6]。以任务为中心的可用性评价具有如下特点：评价的目的在于通过执行任务发现可用性问题；被测者代表真实的用户；被测者执行的是真实的任务；详细记录被测者的行为和现场环境；通过分析测试数据发现可用性问题。主要缺陷是：在测试过程中，被测者常常在被测对象与用户两种角色间游移；为了控制测试的进程，只能预设一些简单的阶段性的任务，复杂的综合性的任务难于实施；只能设置有限数量的任务，不能发现任务未涉及部分的问题；通常采用简易测试法，样本数量很难达到统计学意义上的要求。

案例 NCSTRL是由NASA、弗吉尼亚大学等机构合作建设的数字图书馆，通过分布式网络把各机构的技术报告整合起来提供一站式服务。为了探讨NCSTRL存在的可用性问题并提出相应的修改建议，由3个可用性专家采用共同发现法执行规定任务以发现可用性问题。任务包括三个方面的内容：①查询技术报告(分别测试简单查询和复杂查询)；②浏览馆藏；③登录并发布报告。在完成任务过程中发现两类可用性问题：①一般性问题，包括术语、反馈、图片、布局、一致性、主页设置的问题；②数字图书馆的特定问题，包括浏览、查询、过滤、文献传递方面的问题。专家们对各问题都提出了相应的修改方案，并根据问题的严重程度和修改成本列出了修改优先级。上述评价表明，通过可用性测试能有效地发现数字图书馆可用性的优缺点，对其他数字图书馆的开发具有借鉴作用。[7]

2.3 以用户为中心的模式

20世纪80年代后期人机交互研究逐步转移到“以用户为本”的价值观上来，其标志是采用动机心理学和认知心理改进人机交互系统的设计，目的是让机器适应人，适应人的行为和认知[2]，这一观念应用到数字图书馆可用性评价上就形成了以用户为中心的模式。以用户为中心的模式在关注数字图书馆技术和内容的同时，更强调用户类型、需求特征、信息行为、工作环境、服务模式与可用性之间关系，试图从心理学、社会学、人类学、人体工效学等角度研究用户，吸收用户参加数字图书馆生命周期各个阶段的可用性评价，邀请用户参与数字图书馆开发来提高可用性。早在1997年Covit等就认为用户的观点对数字图书馆可用性起着重要的作用[8]。Blandford等亦认为用户的观念和体验非常关键，在数字图书馆可用性决策中必须慎重考虑[9]。以用户为中心的可用性评价模式具有如下特点：评价的目的在于从满足用户的信息需求出发去发现可用性问题；重视用户研究，研究不同类型、不同情境下用户的需求、行为和认知方式；强调用户参与，从确定可用性标准、制定测试任务到实施测试都强调用户的参与。主要缺陷是：用户类型多样，被测者的代表性直接影响评价的效度和信度；不同类型的用户有不同的需求、行为和认知方式，导致不同评价结果之间缺乏可比性；用户与开发者或评价者之间对可用性的理解存在差异，如何调和他们之间的分歧并非易事。

案例 Primo系统是Ex Libris的异构数据库整合平台，能为数字化信息资源的发现和传递提供解决方案。为了提升系统的用户体验，开发者在开发过程中对查询页面和查询过程进行了可用性测试。测试采用自言自语协定和访问重点人群法，把16个被测者平均分成两组：①第一组使用α版，执行7个任务；②第二组使用β版，执行9个任务。测试表明，系统界面友好、易学、易用；界面布局较为理想，被测者对页面各元素的注意力分配适当；检索结果列表页面提供多种精简方法，获取渠道标识清晰。存在的主要问题是术语不够明确、图标不够直观，需要增加链接和提供更多反馈信息。上述评价得出的结论是，在数字图书馆建设上既要加强信息资源的整合，又要增加有助于提高用户体验的元素，才能吸引更多的用户。[10]

2.4 审美模式

审美模式关注数字图书馆的功能美和形式美两方面，其中数字图书馆的有用性构成了功能美的主要内容，而界面色彩、字形、图片、布局等则以形式美的方式使用户产生美的感受。数字图书馆的功能美和形式美之间相互包容又具有主从关系，功能美是基础，形式美会使用户对信息内容、系统性能产生强烈的感受，进而影响到对数字图书馆的偏好，如Saracevic等认为在信息检索系统中字号的变化、间距的疏密、色彩的浓淡会影响到用户使用的效果[3]；审美产生的光晕效应对可用性会产生深刻的影响，如Hartmann在实证研究后提出，用户对自认为美的网站，在评价其可用性和有用性时会出现虚高的现象[11]，Saracevic也指出用户对认为美的系统会产生喜欢的倾向，进而影响到对内容可信性的判断[3]。从目前来看，以审美模式独立展开数字图书馆可用性评价的案例还不多见，普遍是把审美作为可用性的一个特性或者是满意度特性中的一个属性进行评价。审美模式的可用性评价的特点是从审美的角度评价数字图书馆的可用性，主要缺陷是：由于被测者对美的主观感受与其背景、任务、环境等因素有关，因此评价具有主观性，很难有客观的评价标准，不同的评价结果之间也缺乏可比性。

案例 DocSouth是北卡罗莱纳大学图书馆于1996年建立的数字图书馆，由于技术的发展和馆藏的增加，已显得老化过时的网站需要更新升级，为此Norberg等对网站进行了可用性评价，为改版提供依据。可用性评价包括用户界面、查询功能、浏览功能和视觉美感四个方面，其中的视觉美感评价采用了可用性评价的审美模式。评价采用自言自语协定，被测者包括6个学术用户和2个普通用户，要求利用DocSouth和另一商业化数字图书馆分别完成特定任务，以评价界面设计的效果。被测者认为DocSouth主页上的导航条不够美观、浏览工具不容易找到、馆藏列表区分不明显、已访问的链接颜色与底色反差不太、收集用户反馈的链接不容易发现；网站界面色彩阴晦，缺乏吸引力，总体感觉是“过时”、“不专业”。上述评价结果表明，网站美感与其可用性和功能性密切相关；视觉美感不是一个孤立的因素，它与信息传播方式和用户体验密不可分。[12]

2.5 人类学模式

人类学模式是指研究人员亲自参与研究群体的某些正常活动，在生活实践中获得第一手数据，并由此推导出研究结论的一种研究模式。数字图书馆可用性评价大都是移植一般可用性评价的理论和方法，但随着研究的深入，学者们逐渐发现这些理论和方法不能很好地解释不同类型、不同需求的用户行为的特殊性。Anderson等就反对采用一般可用性标准来评价数字图书馆可用性，他们认为在可用性评价中收集的数据如果不考虑情境因素的话都是毫无意义的[13]。把人类学研究模式引入到数字图书馆可用性评价中，能够从社会或组织的框架内对数字图书馆可用性有更深入的理解[12]，它具有如下特点：用户研究必须置身于具体的情境中，利用人类学研究的“深描”[14]方法对不同类型、不同需求的用户行为进行解释，经过研究者→用户→研究者的多次反复；把人类学研究的有效方法，如田野调查法(参与观察法)、跨文化研究(比较分析法)、全貌观察法和概念分析法等引入到可用性评价中来；运用人类学的主客位研究法分析和解释数据，既能反映研究者的立场，又能体现被研究者的立场[15]，能够客观、真实、全面地反映用户的行为。人类学模式的主要缺陷是：测试者需要长期置身于被测者社群中，研究周期比较长；被测者社群或测试情境的代表性直接影响到可用性评价的信度和效度。

案例 IREON(International Relations and Area Studies Gateway)是德国国际和安全事务研究所(SWP)等机构组建的门户网站。Jahn以人类学的视角对IREON进行了可用性评价，从整体的角度考察用户使用数字图书馆的特点。为了完成评价任务，Jahn曾在SWP 工作了7个月之久，研究过SWP的日常工作，熟悉SWP的工作人员，按照人类学的观点能较好地实现主客位观察的互补效果。其评价分为三部分：①在开发早期，通过访问重点人群法了解7个国际关系和地区研究领域学生利用数字图书馆和互联网查找信息的区别。调查表明被测者能接受网络信息查询方式，但缺乏专业领域的文献知识和提高检索效率的基础知识；希望能直接、免费获得文献，这有可能使用户轻视IREON中书目记录的作用。②在开发中期，采用多元走查法选择5个图书馆学或信息服务业的专家按可用性问题列表评价系统，专家们普遍认为主页给人的感受是可信度高，但检索功能单一、检索结果不便浏览、网页用词过于专业、图标含义模糊。③当系统开发出来后，采用自言自语协定要求6个SWP研究人员、6个国际关系和地区研究领域硕士以上的学生执行特定任务测试数字图书馆的可用性。结果表明被测者缺乏信息检索的基础知识；喜欢按时间顺序排列检索结果；希望能直接获取文献，当无法直接得到时会关注间接获取的渠道，这表明对用户有可能轻视IREON书目记录的担心是多余的。以上三部分的研究还表明，不同职业的用户对IREON的需要和认识可能完全不同。Jahn通过评价得出的结论是采用人类学模式进行可用性评价，不仅有助于对用户和情境的理解，而且通过主客位研究法能达到更全面的效果；采用人类学视角进行可用性评价不需要太精细的条件，也无须太多的花费，却能有效地发现问题。[16]

3 数字图书馆可用性评价模式分析

前面介绍和总结了数字图书馆可用性评价的各种模式及其实证研究案例，从中可以看出：

3.1 可用性评价模式有多种

数字图书馆可用性作为人机交互系统追求的一个重要目标，取决于用户、任务、工具和环境四个要素之间的动态作用，可用性评价又涉及硬件设计、软件设计、信息科学、人体工效学、美学、心理学、行为科学、认知科学、人类学、社会学、经济学、数学等学科领域，按不同的目的、视角、理论和方法展开，从而形成多种评价模式，而每一种新模式的出现都意味着可用性评价研究的深化和发展。例如，在可用性研究早期形成的以系统为中心的模式，依据行为主义心理学理论进行用户研究，体现了“以机器为中心”、“以技术为本”的思想；稍晚些出现的以用户为中心的模式则采用动机心理学和认知心理学进行用户研究，体现了“以用户为本”的价值观念。两相比较，后者对数字图书馆研发的影响虽不如前者那样直接，但其对用户的需求、行为和认知方式的研究却深刻透彻得多。

3.2 不同的评价模式可以结合使用

在数字图书馆可用性评价中，以系统为中心的模式、以任务为中心的模式、以用户为中心的模式是三种基本的模式，其他各种模式都是在这三种基本模式的基础上按不同的目的、视角、理论和方法展开的，可用性评价模式呈现出交叉融合的发展趋势。如前文介绍的以系统为中心的模式案例，除了具有该模式的特点外，从制定评价标准、确定被测者、选择评价方法到分析评价结果都反映了对用户需求和行为的关注；而评价可用性和有用性的数据则都是在被测者执行任务的基础上收集起来的。Norberg等发表的关于DocSouth可用性评价和迭合设计一文[12]，以系统为中心对网站原来的界面和新界面原型进行了可用性评价，从用户的角度选择被测者和分析数据，通过执行任务来收集数据，在对视觉美感的评价中，又体现了审美模式的特点，而作者都是图书馆工作人员，有的还是网站开发者，熟悉图书馆用户和工作流程，他们对DocSouth的评价又带有人类学模式的特点。Norberg等的研究不仅把以上五种评价模式结合起来，而且把评价结果和数字图书馆的叠合设计结合起来，文中详细地介绍了数字图书馆可用性评价的过程及其对数字图书馆网站迭合设计的影响。

3.3 各种评价模式具有不同的实现途径

不管是采用一种还是多种评价模式进行可用性评价，其目的都是要测评系统的可用性，比较不同版本不同系统间的性能，改进系统设计，提高可用性。而从前文介绍的案例可知，要实现评价的目的可以有多种途径。例如：评价的对象可以是一个或多个数字图书馆，也可以是数字图书馆的一部分如主页或检索页面；评价的指标可以是可用性标准，也可以是有针对性的任务列表；评价的方法灵活多样，可用性调查法、可用性检查法、可用性测试法这三大方法可以有选择地采用；数据的分析则涉及许多学科领域，从而形成多种评价模式。

3.4 用户研究视角的变化是拓展可用性评价模式的主要动力

随着用户需求和行为的变化、技术环境和经济条件的改变，数字图书馆可用性的评价模式也在不断发展，在这过程中用户研究视角的变化是拓展可用性评价模式的主要动力。长期以来，用户与数字图书馆开发者或工作人员之间对数字图书馆可用性的理解存在很多分歧，这与数字图书馆的技术、内容和服务都有一定的关系，但最关键的是开发者或工作人员如何转变观念，把相关学科领域的研究成果应用到用户需求和用户行为的研究中来。一个典型的例子是人类学研究理论和方法引入数字图书馆可用性评价后，产生了可用性评价的人类学模式，它把用户放在具体的情境中进行研究，运用主客位研究法解读有关的数据，与其他模式相比能够更客观、更全面地反映不同类型用户的需求和行为。

标签：数字图书馆论文; 可用性论文; 用户研究论文; 可用性测试论文; 用户行为论文; 图书馆论文; 测试过程论文;

数字图书馆可用性评估模型研究_数字图书馆论文

猜你喜欢