数字图书馆人机交互维数与用户交互性能关系的研究_数字图书馆论文

数字图书馆中人机交互维度与用户交互绩效的关系研究，本文主要内容关键词为：维度论文,人机论文,绩效论文,数字图书馆论文,关系论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

［分类号］G250

DOI:10.13266/j.issn.0252-3116.2014.02.006

1 引言

传统的信息检索模型将信息检索的过程简化为用户输入系统的查询语句与系统中文献的标引相匹配，并判断其相关程度的过程。这种理解忽视用户与信息检索系统的交互性及用户在检索过程中的主体性，包括其信息需求、情境影响、认知发展等。然而，由于忽略用户的信息行为和习惯，传统的信息检索系统遭遇瓶颈而无法有效地支持用户与系统之间的交互。为此，受人机交互研究领域的影响，以N.J.Belkin等为代表的、在情报学领域影响卓著的一些学者们意识到交互性是信息检索的本质[1]，开始关注用户与信息及信息系统之间的交互，产生了一系列研究成果。主要包括：①用户与系统交互而产生的搜索行为研究；②改善交互及搜索过程自动化以支持用户与系统交互的技术研究[2]；③交互信息检索(Interactive Information Retrieval,IIR)系统评估研究。当前IIR研究已从针对传统的信息检索系统延伸到网络搜索引擎、数字图书馆等新兴的信息检索系统，但其强调交互过程中以用户为中心的理念始终不变。数字图书馆作为交互信息检索系统之一的特性获得认同，也有研究分析用户与数字图书馆的交互行为、功能或设计[3]。尽管如此，针对数字图书馆环境中用户的交互行为的研究仍未获得足够重视。

因此，本研究着眼于数字图书馆环境中用户的交互信息搜索行为与交互绩效的关系，试图在构建用户与数字图书馆交互模型的基础上，通过实验研究探讨用户与数字图书馆的交互维度及用户与不同维度之间的交互绩效。研究结果可启示我们哪些交互维度会影响用户与数字图书馆的交互绩效，从而为数字图书馆的开发和设计人员提供改善数字图书馆人机交互功能设计的途径。此外，针对这些维度，我们可更有效地评估数字图书馆的交互功能。要说明的是，尽管用户与数字图书馆提供的服务功能之间的交互也是重要环节，但因本研究着重于用户检索过程中与数字图书馆系统的交互，故对服务功能未予关注。

2 文献综述

2.1 交互信息检索模型研究

为弥补传统信息检索模型对用户需求和情境关注的不足，一些学者从信息检索的交互性出发，提出不同的信息检索模型以体现信息检索的交互特征及检索中用户的核心地位，如P.Ingwersen的信息交互认知模型、N.J.Belkin的片段模型(episode model)及T.Saracevic的分层交互模型(stratified interaction model)是3个经典模型。P.Ingwersen的模型融入信息检索涉及的不同要素，包括社会环境、检索系统、搜索中介、IR系统、文本、用户等，强调交互存在于检索所涉及的所有要素之间：用户的认知空间和信息对象、信息对象和信息检索系统、用户的认知空间和信息检索系统之间都存在不同程度的交互[4]。N.J.Belkin的片段模型强调信息检索是由一系列片段组成的过程，核心是用户与信息之间的交互。用户的目标、任务、与之交互的信息对象的类型、检索过程等因素决定了交互过程的特征和结果。该模型中时间是影响用户与IR系统交互的重要因素，交互是一个不断反复、更新且螺旋上升的过程。因此，寻求合适的方法和途径使信息检索系统界面能够更好地支持不同的交互行为及信息检索策略是信息检索系统界面设计的关键[5]。T.Saracevic的分层交互模型由3个层次，即表层、认知层和情境层组成。交互发生在不同层次，而且每个层次的交互内容有所不同：表层交互体现在用户的查询与浏览、相关性判断等方面；认知层面的交互体现在用户与文本及其他信息对象之间的交互，用户学习并吸收所获信息，从而改变其知识状态；在情境层，用户与任务产生交互[6]。这一模型概括了用户在信息搜索、学习与吸收及利用过程中不同层面的交互。其中，IR系统的界面是用户与系统交互的重要平台，同时也是信息检索系统技术层面的集中体现。

经典的交互信息检索模型启示我们，用户与IR系统的交互是多维的，不仅涉及不同的层次，而且与信息搜索涉及的任务、信息对象、系统技术等相关要素之间也存在交互。因而，有必要从交互的多维性考虑用户与系统的交互绩效。

2.2 任务与用户交互行为研究

N.A.V.House等指出数字图书馆的有效性必须从它对用户任务影响的角度来评价。数字图书馆要确实有用，设计者首先需要理解用户产生需求和利用数字图书馆的更广阔的情境，即用户的具体工作任务和信息行为[7]。T.Sumner也强调指出，理解用户需求、工作、用户界面和交互机制有助于更好地建设数字图书馆资源和提供服务[8]。因而在探讨用户与数字图书馆的交互时，任务是一个重要考虑因素。

实际上，基于任务的信息搜寻和检索早已成为情报学的主要研究课题之一[9]。情报学领域的学者主要关注两类不同的任务，即工作任务和搜索任务。工作任务是用户搜索信息检索系统的动机；搜索任务则是用户为从系统中获取有用信息以支持工作任务完成而展开的搜索活动。不同的研究表明，任务是交互过程中的重要因素，任务在一定程度上塑造了信息检索过程、用户的交互行为特征和交互绩效，影响了他们对所获信息相关或有用性的判断，并决定了信息利用的特点。K.Bystrm和K.Jrvelin发现任务越复杂，人们越需要更多类型的信息来满足信息需求；所需信息的类型越难以准确预测，人们越倾向于咨询专家以获得有用信息[10]。N.Pharo定义了工作任务的维度，包括目标、复杂度、资源、规模和平台。其研究结果表明，工作任务和搜索任务在塑造用户信息搜索行为方面扮演了不同角色，但是不同维度的工作任务是如何影响用户信息搜索行为的仍需深入研究[11]。C.F.Landry则调查了工作角色和相关任务对牙医信息源选择的影响，结果显示，与工作角色相关的任务类型显著影响了牙医对信息源的选择[12]。Li Yuelin和N.J.Belkin发现工作任务影响用户交互的多个方面，如系统的选择、网页的浏览量、查询语句的提交量等[13]。此外，就搜索任务而言，任务类型不同，用户花费的时间、采取的搜寻方式、行为特点等均存在差异[14－15]。可见，搜索任务类型不同，用户与网络的交互特点也不同。这些研究表明，无论工作任务还是搜索任务均在一定程度上塑造了用户与系统的交互，尤其是用户对任务的理解和感知影响了用户的交互绩效[16]。

2.3 数字图书馆评估与可用性研究

数字图书馆是一种特殊的信息系统，资源、计算机系统、用户和使用(使用可与用户结合)是其典型的构成要素。对三者的侧重形成了不同的评估思路，分别是以内容为中心、以系统为中心、以用户为中心。其中，以内容为中心的评估关注的是内容质量、内容范围、信息组织、有效性、效率；以技术为中心的评估集中关注界面设计、导航、系统表现、系统配置、安全性等；以用户为中心的评估关注的是用户类型、用户情境、用户搜寻行为、可用性、需求、期望、对用户的影响等[17]。从系统角度还是从用户角度出发影响着数字图书馆的设计和评估，早期的研究多集中于技术、系统性能而非互动性[18]，但G.Marchionini等强调指出数字图书馆设计、建设和评价的所有努力都应植根于用户的信息需求、特征和情境。数字图书馆研究已经从建设的技术层面转移到满足用户需求层面，而评价用户需求的一种方式就是从用户角度确立数字图书馆的评价标准[19]。Xie Hong Iris通过招募48个用户来建立数字图书馆的评价标准，结果显示，界面可用性和资源质量被认为是重要的评价标准，界面可用性包括总体的可用性、界面可用性(搜索和浏览、导航、帮助的可获取性)及其他；馆藏质量包括总体内容、质量(范围、权威性、准确性、完成性、及时性)和其他[20]。T.Saracevic也提出了一个重要观点，即认为评估的最终目的是研究数字图书馆如何改变研究、教育、学习和生活。这一观点引出了一系列相关问题，包括评估什么、用什么标准评估、在什么范围内评估、评估情境、从哪些角度评估等等[21]。他在文献回顾的过程中发现很多的研究报告了同样的结果：用户使用数字图书馆时会遇到很多困难[22]。Theng Yin Leng等从用户调查的结果中发现强大的搜索性能、清晰的结果展示会使数字图书馆的服务更加有效；很多用户在使用过程中经历过迷航和信息不充分，从而难以理解数字图书馆的结构[23]。J.Y.Thong等的研究也显示用户感知的有用性和易用性是用户接受数字图书馆的决定性因素[24]。因而J.C.Bertot等从功能性、可用性和可获得性三方面来评估数字图书馆，更强调满足用户需求的能力而不是严格强调技术[25]。

在以用户为主进行的数字图书馆评估中，可用性被广泛应用，成为设计和评估数字图书馆的核心[22]，Xie Hong Iris甚至指出大多数的数字图书馆评估研究都是可用性研究[20]。可用性的经典定义是ISO所给出的——“产品在特定情境中被特定用户使用以达成特定目标时的有效性、效率和满意度[26]”，这一定义被移植到数字图书馆评估中，可用性评估被认为是衡量系统对特定用户在特定情境中完成特定任务时的可用性属性[27]。从这个广泛意义上来说，可用性评估可以被认为是描述和评价用户与系统之间交互的所有操作。但作为一个总体性的标准，目前学术界对其涵盖的内容尚无统一的意见。T.Saracevic将其概括为信息内容、搜寻任务过程、形式、总体评价[22]；Zhang Ying的研究较好地总结了近年来数字图书馆的评估研究，并对可用性评价指标进行了梳理，这些指标包括内容评价、界面评价指标等[28]；Xie Hong Iris将用户对数字图书馆的评价标准归纳为可用性、内容品质、服务品质、系统效率及用户意见[20]；S.Buchanan等研究指出有效性、效率、艺术化界面、术语修辞、导航、可学性是数字图书馆可用性的关键属性[29]；A.Abran等提出的可用性指标包括有效性、效率、满意度、安全性和可学性[30]；G.Tsakonas与C.Papatheodorou指出的属性则包括可学性、易用性、美观的界面、导航性和术语[31]；J.Jeng构建了一个可用性评估模型，主要包括有效性、效率、满意度、可学性4个方面，其中满意度又包括易用性、信息组织、标签、视觉界面、内容、纠错[32]；S.Joo通过调查方式确定了学术数字图书馆的可用性评估方式，包括4个维度，即效率、有效性、满意度和可学性[33]。尽管这些指标命名有所差异，但从含义解释可以看出它们具有明显的关联，如易用性与效率相关联[34]，美观的界面与吸引力相似，进一步与满意度相联系[35]，但对用户来说，相较于系统美观及其他支持性特征，数字图书馆系统的可学性和可靠性更为重要[36]。当前，各类评估模型和可用性指标已被广泛用于数字图书馆评估实践中，尽管仍未形成学术界一致认同的评价体系。

2.4 用户与信息的交互

C.Cool和N.J.Belkin通过分面分类的方法[37]，将用户与信息的交互分为不同的类型，包括沟通行为、信息行为、交互客体、交互共有维度和交互准则。情报科学领域长期研究的相关性问题，通过探讨相关性的本质及相关性判断标准则体现了用户与信息内容交互的重要方面。“相关性(relevance)”一直是信息检索系统构建和评价的基本出发点和准则。在该领域，T.Saracevic做出了开创性的研究[38]，并总结了40余年来相关性研究的成果，剖析了研究存在的弊端及研究发展的方向[39－40]。近年来，随着用户导向的交互信息系统评估的发展，N.J.Belkin提出用“有用性(usefulness)”作为交互信息检索系统评估的基石更为有效[41]。这些研究体现了用户在搜索过程中与信息内容交互的重要性。

2.5 研究模型

基于文献回顾，本研究初步构建用户与数字图书馆交互的理论模型，如图1所示：

图1 用户与数字图书馆交互模型

该模型表明，数字图书馆是信息与信息技术的结合，数字图书馆通过信息技术的支撑，将信息提供给用户；用户与数字图书馆在信息、技术和任务3个维度上进行交互，而用户是该过程的核心。基于该模型，本研究探讨用户与数字图书馆的多维交互与用户交互绩效之间的关系。

3 研究方法

本研究采用实验研究方法探讨用户与数字图书馆的交互维度及交互绩效。实验方法是研究交互信息检索常用的方法。该方法通过观察、问卷调查和访谈等方式实现数据的有效收集，可以帮助研究者更真实、细致地了解用户与数字图书馆交互的过程。换言之，用户在搜索前、后完成相应问卷，能更真实地反映其搜索过程的真实状态，从而提高研究数据的真实性与可靠性。

3.1 变量与测度

根据研究模型及以往的研究，如Zhang Xiangmin等[3]、Li Yuelin和N.J.Belkin[13]及Zhang Ying[28]等人的研究，本文确定了交互维度与交互绩效等变量的定义及测量指标，对各指标进行解释(见表1)，并采用李克特(Likert)7点量表来衡量。交互绩效虽用了3个指标，但数据处理时，采用三者的平均值作为用户交互绩效的测量值。由于“感知挫败程度”和另两个指标的逻辑相反，数据收集时，针对用户搜索过程中是否有挫败感，李克特7点量表设定“1”为完全不同意，而7为“完全同意”。数据处理时，笔者对数据进行重新编码，即将原数据中的“7”改为“1”，依此类推，使3个问项的逻辑一致。

笔者将指标解释转化为陈述语句设计量表。如针对导航清晰性，问卷中要求实验参加者就“这个页面的导航很清晰，您能很容易地访问任何页面”从“完全不同意(1)”到“完全同意(7)”中选择其一，以表达其态度。

3.2 实验设计

3.2.1 实验系统 CNKI是中国知名的数字图书馆，具有良好的用户基础，是学生平时最常用的数字图书馆之一。此外，它所收录的文献涵盖不同学科，能够满足大多数专业学生的检索需求。因此，本研究选择CNKI作为实验系统。

3.2.2 实验场地和设备为了消除实验对象的紧张情绪，尽可能反映用户与数字图书馆交互的真实场景，本实验场地的选择与被实验者平时使用数字图书馆的场地相一致，即选择网络环境较好的学生宿舍和教学楼进行人机交互实验。研究小组在笔记本电脑上安装屏幕录像专家V7.5，以记录参加者与CNKI的交互过程。

3.2.3 任务设计任务的目的是使实验参加者与数字图书馆产生交互。任务设计是IR实验中的关键环节之一。自P.Borlund和P.Ingwersen[42]提出模拟仿真工作任务(simulated work task situations)这一概念以来，此种任务设计方法已被广泛采用。然而，由于模拟仿真工作任务并非用户的真实任务，一些学者质疑模拟仿真任务的效果并通过研究发现模拟仿真与真实任务导致的用户搜索绩效的差异[43]。考虑到这些因素，本研究采用两项任务使实验参加者能够从CNKI系统中找到所需信息，一项是研究者设计的模拟仿真工作任务，另一项是用户提供的真实任务，试图在一定程度上避免模拟仿真工作任务可能带来的偏差。以下为本研究采用的任务：

任务1：真实工作任务

工作任务情境：请你选取最近需完成的论文、作业、研究项目等，为完成该论文、作业或研究项目，你需要搜索相关信息。

搜索任务：请尽你所能，利用CNKI系统进行搜索，将对你有用的搜索结果保存在自建的文件夹中。检索时间为15分钟。

任务2：模拟仿真工作任务

工作任务情境：假设你是一名人大代表，人大会议召开在际，你比较关注增值税改革的问题，需完成一个提案，主要内容是提出增值税改革建议及新税制改革的方法和具体运行模式。为此，需要了解学术领域对该问题的研究及不同观点，并试图将这些观点整合到你的提案中。

搜索任务：请尽你所能，利用CNKI系统进行搜索，将有用的搜索结果保存在自建的文件夹中。检索时间为15分钟。

模拟仿真任务选择了一个社会热点问题，且不受太多学科知识的限制，不同专业的学生比较容易理解。为避免实验中的学习效应(learning effects)，真实和仿真任务的执行顺序在实验对象中交替轮换。

Li Yuelin和Hu Die的研究表明，本研究中的真实和模拟仿真任务虽在任务的属性和特征方面存在某些显著差异，但并未显著影响用户的交互绩效[44]，因而本文将它们视为同质的任务对待。

3.2.4 问卷设计为收集实验过程中的相关信息，本研究设计了一系列的问卷，包括基本信息问卷、预搜索问卷、搜索后问卷和CNKI界面评估问卷。问卷内容分别涉及实验参加者的基本情况，用户与信息、任务、技术3个维度的交互情况(基于表1的各项测度指标)以及用户对检索过程的评价等。

3.2.5 实验程序实验参加者首先需要阅读和签署实验参与同意书，随后填写基本信息问卷并确定其自选任务主题，阅读任务1的要求并填写预搜寻问卷，然后阅读出声思考指南，在CNKI系统中根据任务完成搜索，搜索时间为15分钟。在搜索信息的过程中，需要参加者保存有用信息，同时说明保存某种信息的理由。在完成任务1的搜索后，填写搜索后问卷。之后重复之前的步骤完成任务2的搜索。完成所有任务的搜索和相关问卷后，研究人员对实验对象进行短时间的访谈并结束实验(见图2)。每次实验平均耗时1小时，从2012年4月2日到4月13日完成所有实验。

图2 实验程序

3.3 实验参加者的基本特征

考虑到CNKT的使用对象及用户的搜索水平应相对一致，本研究招募了42名本科生参与实验，男女比例分别为33.4％和66.6％，他们来自17个专业，其中50％来自图书档案类专业；54.8％的参加者表示接受过网络搜寻(浏览或搜索)方面的专业培训，如上课、参与研讨会等。

通过问卷了解参加者使用CNKI的基本情况(见表2)。根据参加者使用CNKI的年限，将其使用CNKI的经验划分为3类，即一般、有经验和经验丰富。根据每周使用CNKI的次数，将参加者的使用频率分为较低(小于每周1次)、一般(每周1－2次)和较高(每周3次及以上)。根据参加者的自我评价，基于李克特7点量表，将其对CNKI的熟悉程度划分为比较陌生、一般和比较熟悉3类，其中1－3分为比较陌生，4分为一般，5－7分为比较熟悉；将其检索水平分为较低、一般和较高，1－3分为新手(水平较低)，5－7分为专家(水平较高)；将其检索效果划分为比较失败、一般和比较成功，1－3分为比较失败，5－7分为比较成功。结果显示，参加者在CNKI的使用时间、熟悉程度、使用频率方面集中在“一般”水平；大多数参加者自评检索水平“一般”或“较低”，但自评检索效果却是“比较成功”。

3.4 数据处理

使用Pearson相关性分析及Stepwise多元回归，分析用户与信息、任务和技术这3个维度的交互对用户交互绩效的影响。

4 研究结果

本研究基于实验研究的部分数据，即预搜索和搜索后问卷的数据进行分析。录像数据的分析将另外撰文。

4.1 技术维与交互绩效的关系

Pearson相关性检测表明，栏目信息组织的合理性(r(42)=0.315，p＜0.05)、导航清晰性(r(42)=0.317，p＜0.05)、系统反应速度(r(42)=0.320，p＜0.05)、结果显示有效性(r(42)=0.311，p＜0.05)、界面易用性(r(42)=0.358，p＜0.05)与交互绩效显著正相关。

Stepwise多元回归分析结果如表3和表4所示。

模型2的R方为22％，其解释程度较为理想。通过对正态分布假设的检验、Tolerance指标对共线性假设的检验及Durbin－Watson的值对相邻观察值的独立性假设的检验，该回归模型并未违反回归分析应满足的相关假设。因此，该模型是成立的。也即技术维的界面易用性与栏目信息组织的合理性显著影响并可以预测用户与数字图书馆的交互绩效。

4.2 任务维与交互绩效的关系

Pearson相关性分析表明，任务复杂程度(r(42)=－0.355，p＜0.05)和任务困难程度(r(42)=0.401，p＜0.05)均与交互绩效显著负相关；完成任务的方法和过程的熟悉程度(r(42)=0.390，p＜.05)和获得任务所需信息的信心程度(r(42)=0.425，p＜.01)与交互绩效显著正相关。

Stepwise多元回归分析表明，用户找到满足该任务需求信息的信心程度显著影响并可以预测用户的交互绩效，结果如表5和表6所示。

模型1的R方为18％。通过对正态分布假设及Durbin－Watson的值可以看出，该回归模型符合回归分析应满足的相关假设。因此，从任务维来看，用户获得任务所需信息的信心程度可以预测数字图书馆的交互绩效。

4.3 信息维与交互绩效的关系

Pearson相关分析表明，所获信息的充分性与用户的交互绩效显著正相关(r(42)=0.334，p＜0.05)。

Stepwise多元回归分析结果如表7和表8所示。

模型1的R方为11.2％。正态分布假设检验及Durbin－Watson的值显示，该回归模型并未违反回归分析的假设。因此，在信息维层面，用户所获信息的充分性显著影响并可以预测数字图书馆的交互绩效。

4.4 各维度与交互绩效关系的综合分析

考虑到用户与数字图书馆交互过程中各层面的相互作用，本研究以不同层面的指标为解释变量，交互绩效为因变量，通过Stepwise多元回归，进一步分析各变量与用户交互绩效之间的关系。结果如表9和表10所示。

模型3的R方达到38.90％，说明该模型的解释能力较强。和此前的回归模型相比较，该模型的解释能力更强，这也在一定程度上说明用户与数字图书馆在不同维度的交互产生的共同作用影响了用户的交互绩效。正态分布假设的检验及Tolerance和Durbin－Watson的值表明该回归模型满足回归分析的相关假设。因此，用户获得任务所需信息的信心程度、导航清晰性及界面栏目信息组织的合理性显著影响并可预测用户与数字图书馆的交互绩效。由此可见，用户与任务及技术两个维度的交互更显著地影响了数字图书馆的交互绩效，也因此与数字图书馆的绩效更为相关。

5 讨论与结论

用户与数字图书馆的交互维度包括任务、信息和技术3个维度。此前的研究仅从理论上阐述或零散地探讨这些维度与用户交互行为之间的关系。本研究则将3种维度置于同一理论框架下，分别并综合地探讨它们与用户交互行为之间的关系，这是本研究的创新之处。在此模型基础上，本文采用实验研究法分别探讨用户与数字图书馆在任务、信息和技术3个维度上的交互行为，并综合分析用户与这3者的交互对用户交互绩效的影响。研究发现，用户与3个维度的交互在不同程度上影响用户与数字图书馆的交互绩效。尤其是与界面相关的技术设计，如界面栏目信息组织的合理性、导航设计的清晰性及界面的易用性显著影响了用户与数字图书馆的交互绩效，这些指标也同样是衡量数字图书馆可用性的重要指标[28]。因此，结合大量的数字图书馆可用性研究的结果，开发者在设计数字图书馆的界面时，应重视这些方面的设计。

同时，本文提出的结果在一定程度上支持了研究的理论模型，从而为科学地评估用户与数字图书馆的交互绩效提供了理论框架，这是本研究的又一创新点。我们应更多地考虑显著影响交互绩效的不同方面，也即给予其更多的权重。本研究使笔者认识到用户与系统的交互虽是多维的，但不同维度及因素对交互绩效的影响程度却是不同的。基于本研究结果，至少可以将它们区分为3类：预测性因素、显著影响因素及非显著影响因素(见表1I)。未来的研究应通过不同的研究方法验证该分类的可靠性，以制定科学的数字图书馆交互评估体系。

任务是实验研究的重要组成部分。不同的任务设计将带来不同的研究结果。因而，信息检索研究中，任务设计的科学性是研究成果可靠、科学的重要保证之一。本研究同时采用真实和模拟仿真工作任务的实验任务设计思路和方法，一方面确保实验任务具有一定的真实性；另一方面，通过模拟仿真工作任务又可加强对实验的控制。这种方法，力求在真实性和可控性方面达到一定程度的平衡，同时也可检验模拟仿真工作任务的可靠性[44]，从而提高实验结果的可靠性。这种任务设计方法，可以为信息检索实验研究提供借鉴。

研究结果表明，用户获得所需任务信息的信心程度是影响用户交互绩效的重要因素，这弥补了以往研究的不足。相关研究多关注任务的不同方面和维度，尤其是任务的特征[45]，用户获得任务所需信息的信心程度并未被关注，而该因素表明的是用户对任务的认知程度、对任务的总体规划能力和把握程度以及心理优势。研究结果是对任务分面分类法[43]的补充，用户对任务完成的信心也应被作为一种用户对任务的感知而考虑在内。

研究同时启示我们，用户搜索前对任务的理解和感知尤其是对任务复杂和困难程度的判断易产生偏差，因此实验过程中应采取多方面、多角度的方式评估用户对任务的感知和理解，以降低数据的偏差。此外，本研究发现，虽然多数参加者自评在CNKI中的检索水平一般或较低，但自评检索效果却是比较成功的。这一方面说明CNKI确实提供了较好的检索功能，另一方面说明功能较好的数字图书馆可以帮助用户克服和弥补检索能力上的欠缺。可见，高质量的数字图书馆应能支持和满足不同层次检索水平用户的信息需求。

然而，本研究采用的实验研究方法也具有一定的局限性：①只选取两类搜索任务，即真实任务和仿真任务各一个，任务量偏少。②由于各个用户对真实任务的选取各不相同，共有42个真实任务，从而导致真实任务的可控性降低，进而导致结果可能产生偏差。如何对真实任务进行合理的控制还需进一步探讨。本研究并未考察如通过查全率和查准率来检测真实任务与仿真任务是否会对用户检索结果产生显著影响，今后的研究除通过用户自评确定交互绩效外，还需要考察用户检索的实际绩效，以更全面地反映交互的结果。另外，研究的样本量偏小，并局限于本科生，因而研究结果的解释能力有一定局限性，无法推广到其他数字图书馆的用户群体，即尚难以之解释研究生或教师与数字图书馆的交互绩效。此外，虽然不同层次的测度指标来自以往的研究，但是进一步完善不同层次的测度指标仍需做大量的工作。

笔者在未来的研究中将继续探讨数字图书馆环境中的交互信息搜索行为与评估，着重完善实验过程和任务设计，同时扩大样本量，广泛收集和分析数据，以更有效地帮助数字图书馆改善其交互功能，满足用户的信息需求。

收稿日期：2013－12－09 修回日期：2014－01－03 本文起止页码：38－46,120

标签：数字图书馆论文; 信息检索论文; 人机交互系统论文; 用户研究论文; 交互界面论文; 人机交互论文; 绩效目标论文; 系统仿真论文; 绩效指标论文; 关系模型论文; 系统评价论文; 空间维度论文; 工作绩效论文; 用户行为论文; 可用性论文; 维度论文;

数字图书馆人机交互维数与用户交互性能关系的研究_数字图书馆论文

猜你喜欢