数字图书馆用户界面研究,本文主要内容关键词为:用户界面论文,数字图书馆论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
数字图书馆继承和发扬了传统图书馆文献保存、组织、描述、访问和检索功能。数字图书馆用户可以访问、析取和显示数字图书馆信息资源。用户需要很容易地了解他们所能访问的资源对象的类型,如何检索和组织这些资源以便于对哪些是相关信息资源及其存在方式做出快速决策;而且用户也需要处理所检索的信息以便应用于他们的具体工作中。因此,数字图书馆必须提供高级的用户界面(User Interface)来支持用户与信息的交互。用户界面又称人机界面(Human-Computer Interface),是指用户与计算机系统之间的通信媒体或手段,它是人机双向信息交换的支持软件和硬件。数字图书馆用户界面是向用户全面介绍图书馆信息,提供利用图书馆的途径和方法、传递和反馈图书馆的使用效果,并能提供帮助信息的人与“馆”的媒介。一个数字图书馆系统应力图营造一个能够理解用户语言,适应用户操作行为的良好的人机界面,帮助用户有效地使用系统[1]。本文拟对数字图书馆用户界面模式、评价指标、优化作初步论述。
1 数字图书馆用户界面模式
用户界面经历了手工操作、命令语言到图形用户界面3个发展阶段。图形用户界面是当前广泛流行的人机界面,形成了所谓的WIMP界面,即以窗口(Windows)、图标(Icon)、菜单(Menu)和指点位置(Pointing Device)为基础的人机界面。多媒体界面(Multimedia Interface)可以看作WIMP界面的另一种风格[2]。数字图书馆用户界面基本上都是以WIMP界面为基础的,其中以下3种模式代表了数字图书馆用户界面的最新发展。
1.1 自适应可视化界面(Adaptive visual interface)
Bari大学所开发的企业数字图书馆(Corporate Digital Librarv,CDL)具有自适应可视化用户界面[3]。这种自适应可视化用户界面把基于窗体的查询(form-based query)、主题变换查询(topic map query)、基于树的查询(tree-based query)有机地统一在CDL主页上(http://idl.di.uniba.it),并允许用户通过点击排列在页面底部的图标来选择所喜欢的用户界面。用户界面分为3种,即基于窗体的界面(the form-based interface)、主题变换界面(the topic map interface)、基于树的界面(the tree-based interface)。
用户选取基于窗体的界面后,须在窗体中填入某些字段,然后执行信息检索。这是用户与数字图书馆交互的典型模式。用户利用下拉菜单可以选择要查询的文档分类,而且分类索引显示在页面的主要位置。若用户要指定某种查询,至少要在一个索引字段中插入适当的检索词。由于这种基于窗体的界面允许字段的组合检索,因此具有强大和灵活的检索功能,很适合于那些比较熟悉图书馆结构和图书馆知识的用户。
CDL用户界面的一个新特征是它能通过主题变换快速浏览存贮数据。这种可视化实质上是一种人机交互,它能总览一系列文档的语义内容或文档集。语义内容反映了文档集中的主题及其相互组织方式。CDL主题变换具有浏览文档集主题及其重要性、相似度和相互关系的功能,因而十分有用。但只有首先标识用来定义存贮文档语义内容的主题集或描述符,构成CDL词典,才能实现CDL主题变换。CDL利用向量来描述文档与关键词。文档向量坐标和主题向量坐标是这样计算的:当文档D中有T[,i]时,d[,i]等于1,否则为0;当文档D[,i]中有T时,t[,i]等于1,否则为0(d[,i]:代表文档D的坐标向量,t[,i]:代表主题T的坐标向量)。利用这两个向量算出许多关联后,就可对主题或文档变换实行可视化。CDL采用基于彩色技术(Color-based technique)使整个可视化界面更加形象化,并为数字图书馆提供足够的灵活的交互机制。
基于树的界面为用户浏览CDL和执行信息查询提供了另一种可视化方式。这种交互方式的主要优势是每个类目的分类与索引能以树结构方式渐进地显示出来,用户沿着树结构可以一步一步地进入CDL。用户选取某个节点,系统就弹出一个菜单,上有两项内容,一项分解所选节点,另一项说明节点含义,以适应用户的选择。用户在弹出菜单中输入适当的检索词,就能执行检索。
CDL用户界面集成了上述3种界面。它通过利用学习服务器(Learning server)来实现3种界面的自适应。CDL学习服务器是一组学习系统的成套程序,它们能被多个用户同时利用以执行几个任务,如文档分析/分类/理解,以及用户模式的推断。在CDL人机交互(human-computer interaction)环境中,学习服务器可以为每种用户选择独特的可视化用户界面,即为无经验者提供主题变换界面,为专家类用户提供基于树的界面,为教师类用户提供基于窗体的界面。因此,CDL用户界面具有如下优势:①适应了不同层次、不同类型用户对数字图书馆的使用要求;②能针对性地为不同用户提供个性化的快捷的检索界面;③能自动实现3种用户界面的智能转换。
1.2 统一用户界面(Unified User Interface)
得到欧洲委员会资助的合作研究与开发项目研究出数字图书馆的统一用户界面[4]。统一用户界面只包含1个(即统一)界面标准,但适合于所有用户类型,又被称为可变换用户界面(Transformable User Interface)。它由如下4个基本组件构成:
·用户信息服务器(The User lnformation Server,UIS)。它是一个用户信息的知识库,负责通过界面交互组件(The Interactive Components,IC)传达过来的交互数据来推断、执行和报告决策制定模块(The Decision Making Module),并对其中的信息作必要的修改。
·关联参数服务器(The Context Parameter Server,CPS)。它维护与交互有关关联知识,如终端机能力、环境属性等。与UIS相似,CPS可以从内部界面组件或外部资源评价与之关联的监控数据,以发现和注册当前关联交互的修改。
·决策制定组件(The Decision Making Component,DMC)。它基于UIS和CPS与之的信息交流,提供一个推理引擎来确定某些似能适应(Plausible Adaptation),并把这些决策传达给界面的交互组件。DMC具有从交互对话的任何阶段汲取决策的能力。
·交互组件(The Interactive Components,IC)模块。它拥有用户界面管理系统中对话控制的功能,并包含不同种已实现的界面组件(包括设计阶段标识的各种可选的对话方式)。IC模块还负责用一种与界面开发者透明的方式处理目标平台的各种交流。
基于上述用户界面结构,多媒体远程通信应用中的自适应交互项目(Adaptable and Adaptive Interaction in Multimedia Telecommunications Applications,ACTS-AVANTl)开发了统一用户界面浏览器,简称AVANTI浏览器。在AVANTI浏览器中,用户模块服务器履行UIS的作用,具有基于交互监控数据来维护和更新用户模块的功能;DMC是个规则库,这些规则控制了所有交互层次上抽象界面组件与合适的具体实例的交流;IC模块包括浏览器界面、页面表示与交互组件、自适应机制和监控机制;CPS的作用不是由AVANTI中的单独某个软件来承担,而是被分割为某些特殊责任,这些责任分布在其它软件模块中。
华盛顿大学图书馆(Univeesity of Washington Libraries)所开发的WILLOW也是一种统一用户界面(http://www.lib.washington.edu/search/)。它可应用于多种数据库,包括书目/资源列表数据库、图书查询书目数据库、论文索引数据库、数据集、词典数据库名录数据库、电子期刊数据库、电子文本与文档数据库、百科全书数据库和馆藏图像数据库。
1.3 拖放多媒体界面(Drag-and-drop multimedia interface)
Bergman等人运用人机交互的拖放方式,并综合多媒体对象结构化自然语言查询标准设计出一种新的数字图书馆用户界面,即拖放多媒体界面(DanDMM)[5]。它接纳并改善了现有界面的特征与功能,实现了基于实例标准和结构查询语言的无缝结合,能为用户提供高度灵活通用的查询环境。DanDMM规定了表示对象和词组(即查询单元)的可拖动实体,可用某些特殊词组来表示查询、对象、属性与约束,利用拖放操作实现词组的组合与查询式的构建。DanDMM界面把某些约束引入查询式构造过程中,以免在对象与关系的组合中产生语法错误。可拖动组件包括文本项,多媒体对象和标准界面饰件,其中界面饰件包括:矩形框、文本标记、类型输入栏、触发器按钮、选择(下拉)表、增加/删除按钮。界面单元可根据用户行为和应用对象进行动态重构。DanDMM界面能实现基于内容的文本、图像(视频)检索。所有类型的DanDMM界面都以具有①说明查询和次级查询的可复合嵌套式组件;②利用拖放操作来反复使用这些组件;③基于用户定义或应用的动态界面更新:④多媒体对象的自由格式组合;⑤隐藏或展现可选语法为特征。
2 数字图书馆用户界面的评价指标
包括上述3种模式在内的数字图书馆用户界面是否具有很强的适用性?是否有利于发挥数字图书馆的各项功能?这就必须对用户界面进行评价。用户界面评价通常包括功能评价和可用性评价两方面。功能评价是针对用户界面功能及其如何组织和实现的评价;可用性评价是针对用户界面的易学性、易用性、操作绩效、操作满意感,以及用户操作的记忆负荷等因素所进行的评价。在评价数字图书馆用户界面时,可以从如下几个方面进行[6-7]:
2.1 内容管理
提供生成、编辑、查询、删除数字对象的管理接口;能处理调度码,识别数字对象的调度码;链接了外部电子资源;可操作复杂的数字对象,把数字对象间的联系变换为超文本联接的模式。
2.2 互操作管理
提供工具层次的互操作与语义层次的互操作;支持Netscape或Internet ExPlore的运行:可访问Z39.50。
2.3 对话管理
用户在对话过程中能看到查询历史和相应结果集;对话注册可应用于个人帮助桌面;用户可以随时停止一项查询而启动一项新查询;用户在对话中可以返回到前点;用户可以修改和重新启动某个查询;提供下拉菜单。
2.4 检索功能
提供统一检索屏幕(包括地名索引、目录和检索的集成);对元数据可查重,并可存入新对象;用户能选择检索区域(而非利用整个地图作为检索区域);用户能检索不连续空间区域;能提供包括个人著者、团体著者、题名、作者十题名、丛书、主题词、关键词、索书号、ISBN、ISSN等在内的多个检索点;用户可以进行浏览、简单检索、布尔检索、多字段检索、截词检索、近似检索、比较检索、自然语言检索、图像检索、语音检索。
2.5 用户帮助
能给界面添加检索样本以帮助用户建立一个查询;提供关联帮助信息;提供过程学习/培训;能利用FAQ类指导信息。
2.6 数据分配
能通过在线链接访问数据;脱机访问或定序过程能清楚地显示出来;可以利用划分大型文档进行传输的功能;提供检索结果的E-mail传送;允许用户存贮或套录检索结果;能提供一个用户工作区,以便把所收集的文献集中到用户命名馆藏中。
2.7 显示功能
能显示查询结果集中的分布及总条目数;用户能利用类型、日期等对查询结果排序;允许用户选择记录的显示类型(如多条、单个或一组记录显示等);可提供简略型、完整型和MARC格式的记录显示;对不同类的数据(如书目、期刊、资料和地图等)有不同的显示格式;在多屏幕显示情况下可提示用户进入其它屏幕的途径;系统可为用户提供设置显示格式、显示状态和显示内容的命令;具有柔和的屏幕颜色和尽量少的屏幕层次。
3 数字图书馆用户界面的优化
Wendi Arant和Leila Pavne认为,连接图书馆所有电子资源的无缝接口(Seamless interface)是图书馆提供给用户的最有用的资源,这种接口应包括如下组件[8]:
·单点入口的元检索(meta-search)接口,这种接口能检索所有的选定资源,并以命中百分比或数目显示检索的相关性。
·与所有相关资源(包括用户帮助指南与服务请求格式)相连的链路。
·与智能代理相似的个人账户,能对相应链路记录进行编译,生成书目或报告,内容表格,E-mail告示和一系列网页书签。
·能访问其它目录和远程资源的多功能接口。
·一个用于用户帮助的具有网上聊天特征的交互组件。
怎样提供这样一种数字图书馆用户界面?基于数字图书馆用户界面的发展现状,我们不妨采取以下优化措施:
3.1 采用基于内容的检索技术
由于图形、图像、视频、音频等多媒体信息已成为数字图书馆中不可缺少的重要信息资源,因此,用户界面应该采用基于内容的检索(content-based retrieval)机制来查询这些多媒体信息。所谓基于内容的检索,是指根据媒体对象的语义和上下联系进行检索。从本质上说,基于内容的检索主要是利用媒体对象的语义、视觉和听觉特征来进行检索,如图像中的颜色、纹理、轮廓、形状,视频中的镜头、场景、镜头的运动,声音中的音量、音调、音强、带宽、音长、音色等,因此它分为基于内容的文本检索、图像检索、视频检索和音频检索四大类[9]。目前国内外数字图书馆大多数只能提供文本检索,而能同时提供两类或三类检索的数字图书馆用户界面并不多,能实现四类检索的用户界面更是凤毛麟角。如上述的CDL、WILLOW、亚力山大数字图书馆(Alexandria Digital Library,http://www.alexandria.ucsb.edu/)、北京大学图书馆(http://www.lib.pku.edu.cn)等实现了基于内容的文本与图像检索;昆士兰数字图书馆(Queensland Digital Library,http://www.architect.uq.edu.au/digilib/index.html)实现了基于内容的图像检索;DanDMM实现了基于内容的文本、图像与视频检索;上海交通大学数字图书馆(http://www.lib.sjtu.edu.cn/)实现了基于内容的文本与音频检索;美国国会图书馆(Library of Congress,http://lcweb.loc.gov)、上海数字图书馆(http://dllib.digilib.sh.cn/index.htm)、加利福尼亚大学伯克利分校(University of California at Berkeley)数字图书馆(http://elib.cs.berkeley.edu)、卡拉奇梅隆数字图书馆(Carnegie Mellon Univemrsity Digital Library,http://ul.cs.cmu.edu/)等实现了基于内容的文本、图像、视频和音频检索。
3.2 引入智能代理技术
智能代理(Intelligent Agent)是一套软件程序,它使用代理通信协议进行信息交换,以实现问题的自动解决。换句话说,它是在用户没有明确具体要求的情况下,能根据用户需要,代替用户进行各种复杂的工作,如信息查询、筛选、谈判、管理等,并能推测用户的意图,自主制定、调整和执行工作计划[10]。智能代理的核心技术包括机器技术、内容技术、访问技术等。其中机器技术中的推理机能够通过其外围逻辑接口输入进行逻辑推理,从而使代理产生各种可能的行为。机器技术中的学习机则提供了修改外部数据(规则基)和长期事实的能力,包括增加新规则、修改过期的规则,增加新的事实和修改无效的事实,修改信任系数等等;内容技术与机器技术息息相关,是机器技术中推理机、学习机等引擎运转的基础。这里,内容是指机器用于推理和学习的数据,主要包括属于结构化知识的规则、语法,大量非结构化的通用知识和结构化的数据;访问技术提供了代理应用之间的交互与代理和用户的交互。基于智能代理的用户界面能满足用户对友好界面的高要求,使人机界面“个性化”和“智能化”。
3.3 开发多通道用户界面
多通道用户界面(Multimodal User Interface)是基于视线跟踪、语音识别、手势输入、感觉反馈等新的交互技术,允许用户利用多个交互通道以并行、非精确方式与计算机系统进行交互,旨在提高人机交互的自然性和高效性的第三代人机界面。与传统的图形用户界面相比,多通道用户界面具有许多优势:首先,多通道交互可以利用各种通道、设备和交互方式的互补性来显著提高界面对用户输入的识别率和界面向用户输出时的表现力。其次,多通道界面对语音/听觉的强调,有利于弥补现有界面在这方面的不足。第三,多通道在系统中并存的冗余性能够带来不小的鲁棒性、对环境与用户的适应性以及用户可选择性。第四,多通道交互能够提高输入/输出的带宽,引入自然的交互手段,帮助人机交互中意义的顺畅交流。第五,有助于解决交互设备对用户“生理资源”的竞争问题,克服用户过分的繁忙[11]。目前国内外已提出了基于自然交互方式的多通道用户界面模型(VisualMan)、基于事件—目标的多通道用户结构模型(E—O模型)、分布式多通道用户界面模型(DMMI)、面向任务的多通道界面结构和整合模型(ATOM)。应用这些研究成果来优化数字图书馆用户界面,无疑将从理论与实际操作上提升数字图书馆用户界面的功能与可用性。