网络图像检索的关键行为研究,本文主要内容关键词为:图像论文,关键论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
【分类号】G353
1 引言
虽然身处“读图时代”,但是面向图像信息资源管理的用户研究还不多。有限的研究主要集中在图像检索需求上,最早可追溯到1988年Rorvig等针对美国太空总署的关于视觉资源的索引库使用状况的用户研究[1],其后有很多研究针对特定图像数据库进行了类似的用户调查研究[2-5],或者基于图像搜索引擎的提问日志来分析图像检索提问式特征[6,7]。当前趋势是基于大众标签来探寻用户描述图像资源的方式[8]。而针对图像检索过程中的用户交互行为的研究还远远没有展开,目前的研究有:Goodrum等(2003)实验研究了网络图像检索过程中的状态转移[9];Fukumoto(2006)利用通用图像搜索引擎设计实验研究图像检索动作分布和行为模式[10];Yoon等(2006,2009)从检索需求的角度,跟踪研究了图像检索过程中图像检索提问式的表达和调整[11,12]。总体上,图像检索的用户研究需要从需求走向行为,这也是用户信息行为研究的阶段走向,针对图像行为过程的研究有必要深入开展。
本文通过用户实验和行为观测结合的方法,采集并识别图像检索过程中的行为和动作,从关键行为分布和过程状态的转移两个方面来考察图像检索过程中的行为策略和行为规律。研究的意义在于:
(1)在国内率先尝试研究图像检索的行为过程,充实图像资源管理的用户研究的理论和实践;
(2)正如甘利人等研究者所指出的,“今天的研究更多是为检索系统、网络检索界面的人性化设计提供依据,更多将围绕用户与界面交互的机制、影响因素展开,因为它们已经成为影响网络信息检索效果的瓶颈因素”[13]。
2 研究设计及过程
在用户信息行为研究中,有三种主要范式:用户调查、搜索引擎日志分析和用户实验。鉴于用户调查往往浮于表面,搜索引擎日志文件不易获取,实验法在用户检索行为研究中被越来越多地使用。本文采用了用户实验和行为观察技术。具体而言,征集被试,要求被试在实验室环境下借助IE浏览器以自然的搜索方式尽快而准确地完成三个网络图像检索任务,不限定完成每个搜索任务的时间,当搜索困难时,可以随时按照自己的真实意愿选择继续或者放弃。检索过程利用视频软件实现全程记录。数据分析阶段,提取过程视频中的关键行为及序列并进行编码,然后进行统计分析,揭示图像检索的行为策略,探究用户心理。
30位日常生活中经常进行网络图像搜索的本科生和研究生参与了正式实验,最终共采集到有效过程行为样本88个。关于样本量,著名统计学家Gay等认为,实验研究有严密质量控制的15人以上,但最好还是30人以上[14]。同时参照Goodrum等(2003)、Fukumoto(2006)的相关研究经验[9,10],样本量也基本符合要求。
3 关键行为定义及编码
国内外很多研究从不同角度出发对用户的网络信息搜索的行为策略进行分析。Hawk等(2000)以纵览、重复检查、探索、跟随链接、后退和前进、寻求捷径、引擎使用、忠实的引擎使用、引擎搜寻和元搜索等行为为依据去分析用户的搜索策略[15]。Fukumoto(2006)定义了图像检索中4种不同的行为类型[10]:
(1)关键词操作行为,包括动作有输入、增加、删除、替换关键词等;
(2)页面操作行为,包括动作有最大化窗口、应用超链接、应用下拉菜单等;
(3)浏览器操作,包括动作有前进、后退、主页、直跳等;
(4)其他操作。
Goodrum等(2003)定义了图像检索过程中6大类18种行为状态[9],分别是:
(1)网络图像数据库行为,指使用专门图像资源库的行为,包括选择初始图像数据库、更换图像数据库、图像数据库的登录认证;
(2)图像搜索引擎行为,包括初始搜索引擎、更换搜索引擎;
(3)提问请求行为,包括纯文本初始提问、初始复合性提问、视觉特征类初始提问、新文本提问、新复合性提问、新视觉特征类提问;
(4)检索结果集操作,包括网站结果浏览、图像结果浏览、应用超链接、超链接至单个图像;
(5)上下文移动,包括跟踪来源网站;
(6)相关性判断,包括中间性相关判断行为和终结性相关判断。
国内朱明泉等在关于一般网页搜索的用户行为研究中,提取了直接输入网址、使用引擎、提交请求、主题目录链接、相关链接、应用搜索结果、页面跳转、使用导航共8类行为事件[16]。
本文的研究设计中仅考察了被试通过网络图像搜索引擎来搜索图像的行为过程,结合现有图像检索系统的特点,参照Goodrum、Fukumoto、朱明泉等研究者的经验,最终定义了4大类15种关键行为(见表1)。根据表1定义,对88个行为过程中的关键行为进行识别并编码,按行为发生的时间先后次序罗列所有的关键行为,每个关键行为之间以“/”字符隔开,最终形成88个关于行为序列顺序编码的长字符串。
4 研究结果
4.1 行为类型的总体分布
对数据集经过简单模式匹配统计出所有过程样本中的关键行为的出现频次和平均频次,结果如表2所示。
由表2可见,每个过程发生的关键行为和动作平均有48.1个,反映了用户与图像检索系统的积极交互。其中,最多的动作行为是图像结果集的翻页,平均29.3次,其次,比较多的动作是自主性更换提问请求即QC,平均每过程更换提问请求5.5次,再次点击缩略图查看单个图像的行为,平均发生5.1次,最终保存、打印或标记图像的相关性判断行为即RF,平均每过程发生1.6次。
被试更多地选择某1-2个熟悉的图像搜索引擎,选择网页搜索引擎来浏览网站列表或点击网页结果等的情况很少,反映出某种定势心理。
网络上很多图像并非单独存在,而往往作为一个序列组织,如果搜索到类似的一张,那么循着来源网站的线索可能会找到想要的结果,用户对图像需求大多数时候是个大体意象,来源网站会聚集更多风格接近或内容一致的图像,提供更多的选择和比较的机会。实验中观察到根据系统提供的线索由单个图像进入到来源网站的比例并不多,452次具体图像浏览中仅53次进入来源网站,实验仅观察到16个检索过程中应用到了“来源网站”链接,占18%,这表明用户在图像检索中缺乏进一步挖掘信息空间的意识,在搜索思维上偏于单一。
点击相关搜索的发生频次平均每个过程0.8次,实验观察到34个检索过程中使用到了相关搜索,占39%,相关搜索作为一种提问请求调整的跟随性行为,在图像检索过程中不可忽视,虽然用户更倾向于自主地去调整自己的图像检索请求,但是在未有满意结果时,会比较依赖于系统提供的相关搜索。
4.2 检索行为与浏览行为
本文将15种关键行为中但凡涉及提问请求的行为皆归类为“检索行为”,而排除搜索引擎行为、相关判断行为之后的其他行为都归为“浏览行为”。其中ISR比较特殊,被试往往会打开多个搜索结果页面,在某个页面搜索无结果后,会转向另一个已打开的结果页面继续浏览,这种情况可被视为提问请求的调整(已打开的结果页面跟当前结果页面的提问请求是不同的),也可被视为一种对先前检索提问的一种回巡行为,将其归入到“检索行为”之中。检索与浏览行为的具体分类如表3所示:
由表3可以看出,网络图像检索过程中77%的行为都跟浏览有关,而只有16%的行为指向检索提问,包括检索提问调整、利用相关搜索以及回巡先前的检索提问等检索技巧和检索策略。这与Goodrum等(2003)的研究结论是基本一致的,他们图像检索过程中的浏览行为占68%而检索行为占18%[9]。
在网络图像检索过程中,信息浏览的比重可能更大,实验中有少量被试通过点击图像检索结果集滚动菜单栏逐个查看图像缩略图,时间达5分钟之久,过目的图像缩略图超过200张。原因可能是用户在图像需求表达方面的障碍会导致对信息浏览的更多依赖。
4.3 网络图像检索中的翻页行为
(1)平均翻页数
翻页行为是用户检索行为习惯和检索策略的典型反映,同时可以映射出用户信息检索的交互心理。实验中统计用户的翻页行为的原则是:只记录连续的翻页过程,而对翻页过程出现中断后(如点击某个图像缩略图进入单个图像,又进入来源网站等)再在当前结果集继续翻页的情况,则视为新的翻页开始。因为需着重要了解的是:用户习惯于翻多少页会采取新动作,这可以帮助揭示用户在图像检索过程中的心理状态及其变化区域,而翻页过程中的中断会影响用户的真实心理(用户可能会在中断事件中获得心理的某种调适)。
实验中总翻页行为2 577次,就每次检索过程而言,平均翻页数为29.3;就每个提问请求而言,平均翻页约4个页面。与一般网页搜索相比,邓小昭的研究结果是:约有70%的用户只查看了Google检索结果的首页,就每次检索行为而言,用户平均只查看了1.7个结果页面[17];Jansen等对Excite搜索引擎的研究结果是:58%的用户只查看检索结果的首页,用户每次检索平均查看2.35个结果页面[18]。由此可见,就每次检索过程而言,网络图像检索翻页的次数要远超过网页搜索,就每个提问请求而言,图像检索平均翻页数也超出网页搜索近一倍。分析可能的原因在于网页搜索的结果页面以文本为主,需要逐个查看,相关性判断需要花费较多时间和精力,而图像结果列表以图像为主,相关性判断快速而自然,给用户带来较少的认知负担,因此用户浏览图像结果翻页的持续性会大大拉长。
(2)连续翻页单元
进一步考察具体的连续翻页单元的分布情况,图1仅呈现了比例超过1%的翻页单元。在所有的连续翻页动作中,42.1%的属于每翻1页就有新行为,即发生检索过程的状态转移;15.7%的翻页行为是连续翻屏2页后有新动作;有7.6%的翻页动作是连续翻页超过10页之多;连续翻页单元最长的是37页,即被试在连续翻37页后才考虑更换提问请求。
图1 连续翻页高频单元的分布
由此认为,快速调整型行为特征在图像检索过程中十分明显,67.4%的翻页单元为1-3,用户倾向于只看前1-3页,就考虑调整检索提问,经过若干次检索提问调整后,仍不满意,则考虑更换检索工具;与此同时,另一类执著型行为特征也不容忽视,有32.6%的翻页行为的连续翻页单元长度超过4,当图像检索结果不满意时,有许多用户行为倾向于一直翻页。分析原因可能在于用户图像检索技能的普遍缺乏,高检索技巧用户一般表现为调整型特征,而低检索技巧用户则更多表现出执著型特征。
(3)翻页中的跳跃
大多数被试的翻页行为策略是,通过点击“下一页”而逐个翻页。但是当连续翻页多次后仍然没有满意结果时,有些用户会跳跃式翻页,实验中观测到12个被试在网络图像检索过程中具有跳跃翻页的行为策略(ISJ),占被试的40%。跳跃翻页的策略有两种:
①总是点击最靠近“下一页”超链接的那个页码;
②按照一定的间隔次序点击页码,如实验中观测到的8,10,12的序列和7,14,21的序列。
分析跳跃的原因有两种可能:
①跳跃行为是图像检索失去耐性的表现,很多跳跃行为是发生在连续翻页10次之后;
②区域性检索的尝试,试着跳跃到某个区域然后再在该区域左右仔细翻页查找,实验中有一些跳跃行为反映了被试的有意识区域尝试的意图,寻找并定位到一个合适的信息空间区域中再仔细翻查。
4.4 图像检索结果的相关性判断
图像检索结果的相关性判断行为有两种:
(1)最终相关判断,用户保存或打印其认为相关的结果图像;
(2)搜索结果图像比较,用户可能在图像检索过程中打开多个结果页窗口,过程中会二次查看比较,决定是否最终相关。
后者是一种中间性相关判断。
由表2可看出,被试超链接进入并浏览单个图像(1)的次数为452次,而最终相关判断(RF)的次数只有138,即用户只下载保存了其中30.5%的图像,其余图像浏览后放弃。亦即如果用户要找一幅图像,平均需要具体查看3幅图像来判断,这反映了用户进行图像相关性判断的冗余程度在300%左右。
考察最终下载保存的相关图像的获取途径。70.3%的相关性判断是超链接进入单个图像后,浏览具体图像立即判断是否相关;15.9%是二次进入某个已经打开的单个图像窗口,通过比较发现更符合自己的检索需求,判断其相关;11.6%的图像是从来源网站的浏览中找到所需图像;其他2.1%的图像是通过网页搜索浏览相关网页而获得。
由此可见,进入单个图像是图像相关性判断的首要途径;用户具有对已访问过的一些备选图像进行比较的行为需求。图像检索结果的选择则是一个相对判断过程,需要在所点击的图像中找到最满意的那张图像。因此,对图像检索结果的选择,需要在比较所点击浏览过的若干图像的基础上进行。提供必要的界面,支持对点击路线中浏览过的图像进行比较再筛选,将成为图像搜索引擎的结果呈现需要考虑的设计。
5 讨论与建议
通过研究可以观察到一些行为特征和用户心理,对网络图像检索系统的发展提出针对性建议。
(1)定向策略和定势心理。定向策略包括信息空间的定向和检索提问思维的定向两种类型,很大程度上是由用户定势心理带来的。首先是信息空间的定向,用户对某一两个熟悉的图像搜索引擎有较大的依赖,而像Yahoo一类的目录搜索引擎、专业图像资源库等尚未进入用户的日常图像检索行为习惯中;遇到搜索障碍时,用户首先考虑更换搜索关键词,只有在多次更换关键词仍不能获得所需信息时才会考虑更换搜索人口并重复搜索过程。上述两点表明了用户对信息空间的选择具有偏向性和一定执著性,这种定向行为有利于在经验支配下迅速获取信息,但其负面影响也是显然的,不能及时适应变化了的网络信息环境。其次是检索提问思维的定向。图像检索过程中用户倾向于自主地去调整图像检索提问,但提问思维的调整基于小范围的演进,反映了检索思维的某种“定向”特征。实验中大多数检索任务完成时间超过15分钟的用户都呈现出检索思维的定向特征,显然用户局限于他们最初的提问策略,若最初方向有误,将大大影响检索效率。
建议图像检索系统继续加强结果呈现的信息空间建设,如有意识提供给用户除缩略图之外更多的信息线索、来源网站引导、相似图像等功能;加强用户培训意识,对图像检索过程进行适当引导(如图像检索小贴士),推动图像检索过程的高层次交互;相关搜索功能的实现,不能一味沿用文本检索中的语义网络,应结合图像理解的多维度特性,支持多角度扩散性检索思维,引导用户适当地打破检索思维的定向和单一逻辑。譬如当用户根据“对象”搜索不理想时,引导用户采用“动作、事件、环境、形状或颜色”等不同特征来构造检索提问。
(2)浏览策略。研究认为,网络图像检索过程中,来自图像检索系统的认知负担和图像需求表达方面的障碍共同导致了用户对信息浏览的更多依赖。现有的因特网信息搜索引擎多数是在假定用户具有清楚明确的信息需求下设计出来的,要求用户必须具备事前的信息检索知识和技能[19],这给用户赋予了较重的认知负担,很多用户都感到系统难以使用,而浏览却可以在一定程度上减轻用户的这种认知负担。用户在图像检索结果的浏览中,可能获得某些线索,帮助调整其图像信息需求表达的最初概念,或受到某种情景刺激,察觉到自己真正的需求。因此,图像浏览十分有助于用户将潜在图像信息需求转化为现实信息需求。
建议图像检索系统充分整合图像浏览功能,增强检索结果的可浏览性。诸如图像快速浏览工具栏的设置、支持“选择和比较”的类似电子商务中的购物车之类的窗口等功能可以满足用户对备选图像进行比较的行为需求和习惯。
(3)相关性判断的行为特征。用户进行图像相关性判断的冗余程度在300%左右。进入单个图像是图像相关性判断的首要途径;但是,用户具有对已访问过的一些备选图像进行比较判断的行为需求,即需要回访检索路径来选择最相关的图像。
建议图像检索系统有必要提供检索路径回访、对感兴趣图像进行标记等功能来呼应用户相关性判断的行为规律。
(4)图像检索技能偏弱带来的消极心理。图像检索过程中翻页的执著性行为和跳跃性行为的大量存在,能够反映出用户图像检索技能的缺乏,带来的消极心理无可避免,或机械尝试,或失去耐性。
建议针对图像检索的共性和个性,加强用户培训,除了培训用户的一般检索技能之外,还要引导用户熟悉并应用图像检索的个性化检索策略。
收稿日期:2010-11-19
收修改稿日期:2010-12-10