视线跟踪技术在网络信息检索中的应用综述_搜索引擎论文

视线追踪技术在网络信息检索中的应用研究综述,本文主要内容关键词为:视线论文,信息检索论文,技术论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G354 [文献标识码]A [文章编号]2095-2171(2011)02-0095-06

1 引言

随着因特网信息量呈现爆炸式的增长,网络搜索引擎已经成为人们获取网络信息的主要途径。为了改善用户体验,提高检索效率,并设计出具有良好交互的搜索引擎,深入研究用户在网络检索过程中的基本行为是非常必要的。

目前国内外研究者研究用户行为和搜索引擎最常用的研究方法是点击日志分析法,通过分析大量的历史点击数据记录或查询日志,发现用户搜索时的一般行为特征及规律。由于日志文件较容易获得,样本量大,日志的生成受人为因素影响小,数据客观真实,结论较为准确,因而受到研究人员的青睐。Clarke[1]通过用户在网络检索中的点击链接来分析查询关键词、摘要及URL长度对用户搜索行为的影响;余慧佳等[2]人对为期一个月的真实规模数据中文搜索引擎网络日志进行研究,从较大规模的数据中分析了中文搜索引擎用户行为的特点。点击日志分析法虽然有助于我们了解用户的某些行为习惯,但是很难进行用户识别,区分个体用户特征及其与行为之间的关系,而且也不能准确地反映用户的真实意图、内在的心理特征和行为特征。

视线追踪技术的出现,为网络检索研究提供了新的途径,它提供的可视化工具(如热点图、兴趣图)使研究人员可以利用可视化技术为传统研究方法提供有效的补充,挖掘出更为详细的用户与信息交互过程中每一时刻的行为信息,从用户潜意识行为和视觉信息加工的角度对网络检索进行深入研究。

为了详细的说明视线追踪技术的原理和使用方法,本文首先对视线追踪技术中的技术指标与设备及其一般实验过程进行了介绍;进而从用户检索行为研究、检索结果呈现和检索相关性研究三个方面详细介绍了视线追踪技术在网络检索研究领域的应用现状;针对相关研究中存在的缺陷,本文在第四节分析了这些缺陷对研究结果造成的影响并提出了改进方法;最后对未来视线追踪技术用于网络检索研究的发展方向提出了设想。

2 视线追踪技术简介

2.1 视线追踪技术相关设备及原理

针对视线追踪技术的实现方案,Stiefelhage等人将视线追踪技术分为以硬件为基础和以软件为基础两种[3]。

以硬件为基础的视线追踪设备通过加工来自红外线瞳孔摄像机的眼睛视频信息,来识别和确定瞳孔中心和角膜反射点之间的距离变化。通过测量这些点横向和纵向的向量距离,得到各注视点的坐标,从而获得眼动的精确测量值,达到记录分析视线追踪过程的目的。它需要被试者戴上特制的头盔、特殊的隐形眼镜,或者使用头部固定支架、置于用户头顶的摄像机等,因此有强迫式与非强迫式、穿戴式与非穿戴式、接触式与非接触式之分。目前以硬件为基础的系统主要是头盔式眼动追踪系统,它是由头盔式眼动仪和配套计算机组成[4-5]。

用软件实现的视线追踪方法是先利用摄像头获取人眼或脸部图像,然后用软件对图像中人脸和人眼进行定位和追踪,估算用户在屏幕上的注视位置。软件实现的视线追踪系统有摄像头式眼动追踪系统,主要由摄像头式眼动仪和配套计算机组成[5]。由于用户不需要佩带任何测试仪器,因此对用户是无干扰的。

2.2 视线追踪实验过程

在一个典型的眼动实验中,应用视线追踪技术主要是使用眼动仪记录用户的眼动数据,再用其配套的软件工具对眼动数据进行整理统计,根据实验目的和实验类型分析特定的眼动指标,进而分析用户心理和行为。实验通常分为三个阶段:前期准备阶段,眼动数据收集阶段和结果分析阶段。

(1)前期准备。眼动仪是一种精密的记录仪器,需要在实验前进行校验,确定实验过程的影响因素及要注意的问题,明确需要记录的数据及眼动指标,以便进行后期的结果分析。在实验中,通常采用如下指标:①总注视次数(频率);②平均注视持续时间;③对某兴趣区的注视次数;④第一次到达兴趣区时间。

被试人员的数量也是一个重要因素。在进行测试研究时,由于眼动仪的一些固有缺陷,被试人员的数量应增加10%-20%,以便在需要舍弃10%左右不精准数据时不会对实验结果造成很大的影响,从而提高结果精确度。

(2)眼动数据收集阶段。此阶段中,眼动仪将自动记录用户的信息行为和眼动行为,采集的基本数据包括采样时间、注视点的x轴坐标、y轴坐标,瞳孔宽度、瞳孔高度等等。

(3)数据分析阶段。现代眼动仪提供了一系列软件工具(如回放工具、事件日志、场景工具、片段工具)和眼动数据分析工具,方便实验人员在测试结束后进行深入分析。这些软件工具可以快速生成有趣的热点图(heat map)(如图1[17]),扫描路径图(scan path[11])(如图2)等可视化视图。前者表示被试者对界面各处的不同关注度,展示了用户完成任务过程中注视点的空间分布情况,直观地显示了用户兴趣区的特征;后者则反映用户注视点随时间的变化情况。研究者还可以根据实验目的,对眼动仪采集的基本数据进行提取,结合编程和推断统计(例如t检验,方差分析等)进行分析论证,得出实验结果。

图1 热点图

图2 扫描轨迹

3 视线追踪技术在网络检索研究领域的应用现状

早在19世纪人们就通过监测人的眼球运动来研究人的心理活动,尤其是对阅读心理学的研究。20世纪40年代,Paul Fitts研究飞机着陆时飞行员的眼球运动,代表了视线追踪技术的最早应用,也就是现在所熟知的可用性工程(对用户与产品交互的系统研究以提高产品设计)[6]。20世纪60年代以来,高精度眼动仪的研发,极大地促进了眼动研究在国际心理学及相关学科中的应用。眼动仪可以记录眼动行为,揭示用户的注意力和认知过程。目前,该技术已经被推广应用于人机交互研究、阅读研究、广告心理学和交通心理学等各种领域。

本文着重介绍视线追踪技术在网络检索中的应用现状。对于视线追踪的应用,国内起步较晚尚处于探索阶段,将视线追踪技术应用于网络检索的研究主要以国外的一些研究为代表,主要集中在用户检索行为研究、检索结果呈现和检索相关性研究三个方面。检索结果呈现和检索相关性研究建立在用户检索行为研究的基础上,通过后者的研究结果改善检索结果的呈现方式、推断检索结果的相关性从而改进结果排名。本节分别从这三个方面介绍了视线追踪技术在网络搜索研究领域的应用现状。

3.1 用户搜索行为研究

用户的搜索行为反映了用户的信息加工过程和认知过程,其相关研究对以用户为中心的检索系统评估有重要价值。在网络搜索中,用户搜索行为一般分为浏览和点击。用户的浏览模式、浏览行为与点击行为之间的关系成为国内外研究的热点,视线追踪技术作为一种可视化研究方法逐渐被引入到用户信息行为研究领域。

在用户搜索行为研究中,一般设计出不同类型的搜索任务[7],通常分为信息类搜索(用户搜索的信息可能分布在一个或多个页面上)和导航类搜索(查找一个特定的网页)[8],使用视线追踪设备记录用户(一般20~40人)在搜索过程中的信息行为,通过其提供的可视化工具(如热点图、兴趣图),采用定量和定性方法分析特定指标,发现用户的行为规律。

Granka等[9]利用视线追踪技术观察用户与搜索引擎结果界面的交互行为,发现大多数用户只查看并点击Google搜索结果中前两个[10-11],而且浏览检索结果的顺序是从上往下的。Klockner等研究了用户在点击某个检索结果前的浏览顺序,发现52~65%的人采用深度优先策略,即在移到下一结果之前决定是否要打开该结果,11%~15%的人采用广度优先策略,即在评估了大部分或者所有的结果之后才打开某一结果,而20%~37%的人采用了混合策略,这个发现对于改善搜索引擎的结果呈现方式具有很重要的指导意义[12];Nielsen通过视线追踪技术记录232名用户浏览近千个网页的视觉搜索情况,提出了用户浏览网页的视觉模式规律——F形状模式(F-Shaped Pattern)。Nielsen认为,这种F形状模式更多的是粗略、概括性的形状[13];Lorigo等[10]采用注视、瞳孔直径、扫描路径等指标分析了网络搜索中的性别差异和任务差异,发现信息类任务比导航类任务需要花费更长的时间,且在信息类任务中用于浏览搜索结果界面的时间较少,导航任务反之;同时发现用户的浏览路径与任务类型无关,但与用户性别相关,男性比女性更倾向于线性浏览方式且查看更多的结果。以上研究用户搜索行为局限于搜索结果首页,Yuko等则研究了用户浏览多个搜索结果页面时,搜索结果的显示位置对用户的影响,通过分析用户在每条结果上花费的时间,发现用户浏览下一页顶部结果比上一页底部结果花费的时间更长[14]。

3.2 搜索引擎结果展现研究

搜索引擎提供的标准化结果通常是一系列按结果相关度排名的文档替代物(包括标题、摘要、URL等),它们应该如何呈现给用户,也是目前研究的热点。对用户搜索行为进行观察,通过其浏览结果时对不同部分的视觉注意程度,找出他们的兴趣区,视线追踪技术提供有趣的热点图,以可视化的方式展示这些兴趣区的特点与分布。这种方法不但可以追踪用户能否在网页上顺利寻找所需要的信息,还可以发现他们如何以及从何处找到他们所需的链接和信息的,进而发现搜索结果的展现方式对用户的影响。这给标准的搜索引擎界面可用性测试提供了很多有用的信息,尤其是在满足用户期望和提供设计建议方面。通过改进搜索引擎结果展现,可以进一步提高用户的检索效率。

目前采用视线追踪技术对搜索引擎结果展现研究主要有实验性研究和测试性研究两种类型。实验性研究通常是通过指对自变量(如摘要长度、目标结果位置等)进行控制,并通过严格定义因变量、控制标准化的实验程序,从而得出变量之间的因果联系,其研究得出的数据具有预测性。Cutrell[15]通过使用Tobii眼动仪分析SERP页面搜索结果中摘要的长度、目标结果位置及任务类型对用户的影响,发现摘要的长度对于不同任务类型的影响有很大差别:长摘要在用户完成信息类搜索任务时更能节省用户时间,准确率更高,而进行导航搜索任务时,结果相反;对目标结果位置研究发现当目标结果排名越靠后,用户寻找目标结果花费的时间越长,成功率越低[16]。当用户没找到目标结果时,对于导航类搜索,用户通常会选择排名第一的结果,或者重新定义查询词;对于信息类搜索,用户很少重新定义查询词,而会尝试更多的排名靠前的结果,即使排名靠后的结果与任务更为相关[17]。于是Cutrell提出导航和信息类任务的权衡和搜索结果页面上标题、摘要、URL空间位置的分配问题,这对未来的UI信息反馈设计有很大启发。Halverson等[18]利用反应时间和眼球运动研究了链接颜色对视觉搜索模式的影响,为区分访问和未访问链接颜色的建议提供了实证支持。Oulasvirta等[19]研究了搜索结果展现对用户选择和满意度的影响,发现搜索引擎提供结果中查全率的增长会妨碍用户体验,提出把给用户展示的结果集从搜索引擎的结果集区别出来,这种看似矛盾的选择对搜索引擎的结果设计有重要的影响。

然而现代搜索引擎结果页面往往还包含赞助商链接、广告、相关搜索等等,它们对用户信息行为是否有一定影响也引起了研究者的兴趣。最近,Buscher[20]研究了用户在SEAP上不同元素的视觉分配情况,发现用户最关注的是排名靠前的搜索结果,同时页面顶部的广告也受到大量关注,但其关注程度取决于广告的质量,同时通过实验发现当不同质量的广告任意排列时,无论是低质量广告还是高质量广告,它们受到的关注均会下降。Kammerer[21]从用户认知的角度研究了用户是如何对搜索引擎结果进行评估的,发现突出显示搜索结果的信息源能减弱相关权威认知信念(Authority Related Epistemological Beliefs,AREBs)对用户的影响,即信息源的突出显示会影响用户的选择行为,使用户更可能链接到门户网站。

测试性研究往往作为可用性评估的辅助,用于识别设计方案的失败或成功之处。美国Catalyst Group利用视线追踪技术从页面广告链接、搜索首页、搜索结果展示、浏览窗格、快速预览、相关搜索等角度对微软必应搜索和谷歌进行比较,发现必应搜索有更好的组织效果和过滤器选项,其结果展示界面更为友好[22]。Hotchkiss讨论了谷歌三角形,发现用户的视觉焦点集中在左上角[23],但现在很多额外的图片和类目,让用户对结果页面感到迷惑[24],这与强调web可用性和以用户为中心的用户体验是背道而驰的。

3.3 检索相关性研究

在检索过程中,大多数用户只查看并点击搜索引擎提供的前几个结果,若前几项结果不符合用户的期望,他们大都会重新定义查询词,而不是继续翻页查看结果[9-11],因此检索结果的相关性与用户的检索效率密切相关。

目前,根据用户在检索过程中的隐式反馈(implicit user feedback)推断用户兴趣和意图,并将其应用于检索结果排名来提高检索结果相关性是国内外研究热点[9,16,25]。点击数据是主要的隐式反馈形式之一,虽然有效且容易获得,但它提供的信息有限,且用户对搜索引擎存在信任偏好[26],因此用户的点击日志不能准确估评结果相关性。Jarkko[27]将眼动数据与可判别的隐马尔可夫模型相结合推断结果的相关性取得了良好效果,说明眼动数据可以作为一种隐式反馈用来推断结果的相关性[28]。Flavio[29]等利用瞳孔大小变化推断搜索结果的相关性,发现当人们注意到相关结果摘要时瞳孔变大。Georg Buscher[30]等在子文档层面把用户眼动行为作为隐式反馈用于改进搜索结果查准率,使查准率平均提高了32%,但提高的程度取决于被查看的文档的内在结构和用户的信息需求类型。目前,把眼动数据同结果相关性评估结合改进结果排名的研究还处于起步阶段。

4 小结

在网络搜索的研究中,视线追踪技术作为一种新的研究方法受到大量关注,但该方法同样也存在着一些缺陷制约着它的发展。目前的视线追踪技术不能追踪人的周边视力,人的视野98%都是由周边视力构成,我们利用周边视力选择注视位置,所以仅从视线追踪设备记录和显示的注视点位置得到的数据进行分析可能存在误差[31]。由于用户视线运动的随意性而造成计算机对用户意图识别的困难。用户可能注视什么但并非“意味着”什么,而且对眼动数据(如注视点)缺乏统一的判断和解释,收集到的眼动数据可能就无法准确反映用户的行为和意图[32]。尽管目前有人提出与出声思考法(即参试用户在任务进行过程中出声表达自己的想法)相结合,但会造成实验过程中用户被打扰而影响结果准确性。

上述缺陷有些是可以通过人为努力加以避免的,如在进行测试研究时,被试人员的数量应增加10%~20%,以便在需要舍弃10%左右不精准数据时不会对实验结果造成很大的影响,从而提高结果精确度;有的还需要技术设备的进一步成熟,目前已初见端倪的如内置视线追踪仪的计算机显示屏的研发;但有些缺陷却是其自身固有的,需要与传统的研究方法(如日志法、问卷法等)相结合,多种方法的结果相互验证,最终得出准确的研究结果。

尽管视线追踪技术存在着一些缺陷,其优势也是其他方法无法取代的,这也是视线追踪技术发展一百多年来经久不衰的原因之一。另外,由于视线追踪技术在网络信息检索领域中的研究并不成熟,视线运动行为数据与认知活动联系的困难可能是视线追踪技术运用最大的障碍,将注视点模式和与任务相关的认知活动相联系,开发出用户认知模型是未来需要做出努力的研究方面之一。同时,未来的研究还需要广大研究者通过不断完善相关的眼动理论基础和实验设计技术来改进和提高。

标签:;  ;  ;  ;  ;  ;  ;  

视线跟踪技术在网络信息检索中的应用综述_搜索引擎论文
下载Doc文档

猜你喜欢