基于三阶段过程的信息检索影响因素分析_科技论文

基于三阶段过程的信息搜索影响因素分析,本文主要内容关键词为:因素论文,阶段论文,过程论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

〔分类号〕G358

1 信息搜索行为的研究现状

关于用户信息搜索行为及其影响因素,国外已有很多的探索和研究,具体可分为两大类:

● 基于用户信息搜索全过程的分析,比较知名的有Willson模型、Kuhlthau模型和Choo三阶段模型。其中Willson模型重点对影响搜索需求到搜索行为发生的整个过程的因素进行了较全面的分析,如图1所示;Kuhlthau模型重点对信息搜索全过程中的个体认知因素影响进行了分析[1-2],如图2所示;Choo模型将信息搜索活动分为信息需要、信息搜索和信息利用3个过程,并检验了认知、情感和情境因素对这些过程的影响[3],如图3所示。

图1 Wilson关于信息行为的一般模型

图2 Kuhlthau的信息搜索过程模型

图3 Choo的信息搜索过程模型

● 影响用户与计算机系统交互过程的因素探索,比如Choo的信息搜索过程模型,Saracevic的分层模型,如图4所示;Saracevic模型具体就对来自计算机层、界面层和用户层三个分层面的影响因素进行了分析[4]。

图4 Saracevic模型

对诸模型进行考察不难发现,这些模型在研究过程中都特别重视信息用户的个体认知因素。这种研究视角给本文的相关研究提供了较大的启示。

2 科技数据库用户信息搜索行为的阶段分析模型

本文研究的信息用户群是科技用户,即学术型用户。他们可以是自然科学技术研究人员和社会科学研究人员,也可以是高校教师和学生。他们的最重要特点就是不断地承担研究任务;他们在自己的研究中总是需要不断借助于他人的研究成果来启发思路,创新知识,因此需要不断地搜索信息;他们也是科技数据库的主要用户。

在Wilson模型、Kuhlthau模型等的启发下,本文提出了科技用户信息搜索行为影响因素的三个阶段分析模型。如图5所示。

图5 科技数据库网站用户信息搜索行为影响因素三阶段分析模型

如图5所示,我们首先将科技用户信息搜索的实际过程归纳为“任务驱动——需要产生信息源选择——概念选择、检索式与检索方式选择——浏览与反馈选择——全文提取”的循环往复过程;在此基础上,将搜索过程提炼为启动、搜索、获取三个阶段。

与其他分析模型一样,启动阶段是研究搜索行为的重要环节,通过考察启动阶段,我们将确定影响用户期望的因素;本研究的搜索阶段和获取阶段则主要突出了搜索策略制定、实施以及结果获取策略的制定与实施特点。我们认为,科技用户搜索是否成功,与这两个决策环节有很大关系。其中搜索阶段主要解决的问题是信息源选择、用于描述课题主题的概念选择以及与其相关的检索式选择,这一环节的决策几乎决定了后期结果的状态,但该阶段决策的不确定性最大。影响它的因素也很多,尤其是用户主体的知识经验、认知能力以及系统的资源、功能等因素,我们将重点分析这一阶段。最后阶段是获取阶段,包括浏览结果选择、全文信息获取等,这是搜索结果的显示阶段,也是用户将搜索结果同预期进行比较与评判的阶段。在这一阶段中,一旦所得到的结果不符合用户的要求,用户就会中止这一轮的搜索,放弃或者返回到前面的搜索决策阶段,进入新一轮的搜索。在这个阶段,科技用户本身的领域知识起到了核心作用,此外用户所处的环境,如信息系统的服务环境也都会产生不可忽视的影响。

3 基于三阶段过程的信息搜索影响因素分析

3.1 启动阶段

启动阶段是搜索过程的第一阶段。事实上,用户对搜索的最终结果是否满意,在很大程度上取决于他对结果的期待。下面我们可以从信息需要和搜索行为产生两个层面分析。

3.1.1 影响搜索需要产生的因素分析 Wilson认为信息需要是由基本需要引起的,这与心理学中的定义相一致,信息需要与生理学、认知或情感因素有关。当我们想要去了解现实事物的意义和秩序时,就产生了认知需要。一种特定需要的产生是受处境影响的。这些因素相互交叉,有时也彼此影响(Wilson模型也曾强调这一点)[5]。

在本研究的问题中,我们认为影响科技用户信息需求产生的主要因素可以包括科研任务的重要性、急迫性以及用户解决研究中所出现问题的能力。

3.1.2 影响搜索行为产生的因素分析 一个课题任务的复杂性可能使个体产生信息需要,但是信息需要是否必然导致信息搜索行为?按照Wilson[5]观点对其所作的回答是否定的。Wilson主要从心理学角度解释了信息搜索行为的激发和驱动因素,并基于压力/应付理论对这种激发和驱动进行解释。压力/应付理论认为:当个体认为自己所掌握的知识完全可以了解任务情境并作出决策时,他就不会进行信息搜索;但如果他缺少这方面的自信,那么就会由于害怕犯错误或违反社会法律规定或丧失支付能力以及使他人失望而产生压力感。压力越大,搜索信息的动机越强烈,直到达到某一程度后,压力才不再继续起作用。另一个解释理论是风险回报理论,即希望通过应付情境或解决问题获得回报,即使这种回报仅仅是因消除不确定性而带来的舒适感,在这种情况下,人们也会产生信息搜索需要。

中国的科技用户从搜索需要到搜索行为产生的原因也可归结到压力/应付理论中,目前科技用户承接的课题大多都是来自各个决策层急迫需要解决的问题。目前,大多数课题承接途径都带有招标性质,一旦课题完不成或不能按要求完成,则意味着丧失下一次的课题任务。对以研究为主要工作内容的科技人员来说,这无疑是一个巨大的压力,了解研究动态是课题启动的第一步;科技用户也非常重视自己在同事、在组织环境中的地位和声誉,他们不会轻视信息搜索这个重要环节的。

综上所述,我们认为在启动阶段,上述三大因素中的用户个体因素以及环境因素有着比较明显的影响。

3.2 搜索阶段

搜索阶段主要包括搜索策略的产生和实施,其中搜索策略具体包括信息源、信息概念以及信息搜索方式的选择等。由于信息搜索策略对后期的搜索结果和用户满意度会有很大影响,我们将具体对信息源选择、信息概念选择以及信息搜索方式或方法选择的主要影响因素进行深入分析。

3.2.1 影响信息源选择的因素分析 从目前国内的情况来看,信息源的选择更多的是受用户个体经历、偏好以及宣传和人际网络交流的影响。当用户对某一个系统比较熟悉,用户在信息源选择时就比较偏向于这个系统;而系统的宣传以及朋友使用经历的介绍都会产生较大的影响。

个体选择何种形式了解信息源也与个体偏好有很大关系。Marchionini指出由于认知方式的不同,在选择信息源的时候会有一些差异。比如有些人喜欢交互方式,所以就会采用和同事、专家交互的信息搜索模型;而有些人则更偏爱个人去发现所遇到的挑战,所以就将自己沉浸书籍和电子系统中[6]。

用户所处的社会/组织环境也是影响用户信息源选择的一个重要因素,比如高校的研究者能够较容易地获取到学校购买的数据库产品,他们会根据信息的“就近原则”选择这些最易得到的信息源。这一点在Wilson改进后的模型[5]也有提到。在那些还没有建立电子资源的国家,用户选择信息源时则更多地考虑图书馆。

3.2.2 影响概念选择的因素分析 概念选择具体表现为将哪些概念词汇放入搜索框中,其首先与用户对搜索任务主题理解有关,即用户的概念选择受用户的专业知识的影响;概念选择还与用户搜索体验等因素有关。

Eisenberg和Berkowitz认为搜索者在进行信息搜索时,需要对信息需要进行定义。大多数人在定义任务上花的时间非常少。通过准确地定义和理解信息问题,搜索者可以更有效地获得解决方法[7]。

拥有专业领域经验和知识的用户,通常可以被定义为领域专家或者学科专家。依据Mayer的描述[8],专家在领域内的问题解决依赖于专家丰富的领域知识。例如,在信息检索领域中,知识面广的人在相关数据库检索时比新手的效率更高。领域知识还会对用户的术语表达产生影响;对领域术语熟悉的用户所选择的信息概念更为准确[9]。前人对信息检索系统的研究还证明用户的领域知识在检索表现和满意度方面有着重要的影响[10-12]。

3.2.3 影响检索方式选择的因素分析 检索方式主要是指信息检索系统所提供的各种概念组配方式,例如布尔组配。这在一定程度上会影响用户后期的搜索结果。用户对检索方式的选择与系统所提供的搜索功能有关,也与搜索者的知识、经验以及偏好有关。

目前,大多数网上信息都是以文本方式呈现,对语言的理解对大多数的检索任务都非常的重要。阅读文本、检索结果、重新回到首页等任务都涉及到对语言的理解[13]。另外,Hsieh-Yee[14]发现语言能力可以影响所使用词语之间的关联度,这直接导致用户使用诸如布尔检索或者其他的检索语法。此外,Hsieh-Yee[14]在其网络检索任务中的文字组合测试中还发现口语的流利程度和搜索的成功也有很大关系,但这一结论有待更多的研究来验证。

对于网上信息资源搜索,用户的网络经验同样影响用户表达式的构建。前面提到网络经验包括在网络上使用不同类型程序的时间长度和频率,其中包含了浏览和检索的经验。如果用户具有丰富的网络经验我们可以认为他是一个专家,反之我们认为他是一个新手。由于专家具有丰富的检索经验,他们可以根据系统的特征迅速构建合适的检索式,以获得全面而准确的检索结果;而新手需要与系统进行多次的交互后方能掌握系统使用规则,然后才能构造出合适的检索表达式。当然系统使用经验对其也有重要的影响。由前面的分析我们可以知道系统经验就是用户与某个具体的系统交互的经验。如果用户对所选择的系统很熟悉,即使他使用网络的经验不丰富,也可以迅速获得所需结果。

3.2.4 影响系统交互的因素分析 常用网络数据库检索方式有目录检索、关键字检索。检索表达式在前一阶段主要是针对关键字检索而言。在概念选择阶段,用户所面临的是结构化比较强的问题,选择使用关键词检索的用户更多。

在交互过程中,用户对问题描述的清晰度将会影响用户搜索结果。如果用户可以较全面地表达问题,用户就有可能获得搜索的成功。这些取决于个体对课题的熟悉、对搜索知识的了解以及用户相关经验的积累。

在交互过程中,系统也是一个重要的因素。系统中信息资源的组织、分类是否科学、检索方式是否多样化、智能化、界面设计是否科学等因素会直接影响到交互的效果,比如系统所提供的界面是否容易理解、是否能让用户快速寻找到完成任务的功能区域,是否随时为用户提供帮助等。Taylor[15]则强调信息系统设计中对个人情况理解的重要性,他认为信息系统为谁设计是如何设计信息系统的一个重要因素。在Taylor之后,Lancaster[16]也强调在信息系统设计中对用户研究的重要性[17]。

用户所处的情境也会影响用户的信息户动,比如用户必须考虑网络查询的成本费用、查询的时间限制等因素。

3.3 获取阶段

经过搜索策略实施,就进入到结果反馈浏览阶段,也即是搜索结果获取阶段,主要包括题录、文摘、全文信息的获取。这阶段又可分为题录、文摘的选择和全文提取两个环节。

3.3.1 影响搜索结果抉择的因素分析 作为结果获取阶段的第一环节,搜索结果抉择主要是对搜索所获取的题录、文摘的评价与选择。只有经过评价后符合用户信息要求的搜索结果才有可能进入到全文提取环节。

在这个环节中,如果个体的课题知识和语言知识等足够的丰富,系统反馈的信息足够的清晰,则用户对于信息是否符合要求的评判的准确性就高。对搜索结果准确的评判将降低用户信息搜索成本、提高全文获取效率。

3.3.2 影响全文提取的因素分析 经评价后符合预期的结果,有关的全文就会被提取。不管是通过在线获取还是离线获取的全文,都需要在用户仔细阅读后才能确定其对需求的满足性。即使是上述第一个环节中所评价的潜在价值文献,也可能会因为实际全文内容与用户研究任务的不匹配而被否定,因此用户对搜索结果是否满意最终需要在第二个环节确定。

用户最终能否获取到全文则主要与信息资源的提供环境有关系,比如与网站提供商的收费机制有关。如果网站的付费问题没得到很好的解决,那么用户即便在第一阶段对搜索结果满意,还是会离开这个网站而寻找其它免费的或者付费更方便的网站。

4 结语

对于影响科技用户信息搜索行为过程各阶段的因素进行分析,有利于我们认识和探索用户信息搜索过程,理解在这个过程中用户如何最终达到满意状态以及在信息搜索过程中用户的满意度受到哪些因素的影响;并基于这些影响因素构建科技数据库网站用户满意度评测量化研究模型;进而为研究如何提高信息用户服务水平、设计人性化的科技信息服务系统提供有意义的参考。

收稿日期:2006-07-26 修回日期:2006-08-30 本文起止页码:59-62

标签:;  ;  ;  

基于三阶段过程的信息检索影响因素分析_科技论文
下载Doc文档

猜你喜欢