基于觅食理论的网络信息环境实证分析_用户研究论文

基于觅食理论的网络信息环境实证分析,本文主要内容关键词为:实证论文,理论论文,环境论文,信息论文,网络论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1 信息觅食理论研究概述

1.1 信息觅食理论的研究背景

觅食理论(Foraging Theory)最早于19世纪70年代由生态学家和人类学家所提出,目的是为了研究动物的觅食行为和策略,因为动物在觅食过程中,需要不断评估食物所含的能量和捕食所消耗的能量并作出决策,通过选择不同的环境和不同的食物从而达到最优化收益,评估的结果决定了该动物是继续留在该地区捕食还是转向搜寻另一个捕食地区。

在互联网高速发展的今天,特别是网络搜索引擎出现后,人们发现那些正在积极查寻信息的互联网用户,他们的行为与动物的觅食行为非常相似,用户们需要在花费的时间、金钱和精力与获取所需的信息之间达到一种最优化的平衡。因此,也可以将他们的信息查寻行为称之为信息觅食。

在现实世界中,有些工作要求人们面对海量的信息,例如商业竞争情报分析人员,他们必须在规定的时间期限内,在非常不确定的条件下完成复杂的信息觅食计划。因此信息觅食理论不仅具有理论研究的价值,而且对现实人类的信息活动具有很好的指导意义。

1.2 信息觅食理论与信息检索理论、信息获取等相关理论的区别

信息觅食理论与信息检索及信息获取等相关理论是有区别的。虽然在20世纪90年代的认知工程模型中有一些关于人机交互方面的研究,特别是信息检索理论,但是这些理论在处理大量信息时还存在着一些不足。第一,这些模型所研究的任务和任务所处的环境是被准确定义的,可能的目标和潜在的行动已经被事先定义好了,也就是说相关的任务和任务环境已被人为地事先规定。但实际情况是,用户在检索的过程中有可能会试图改变目标或者是改变自己所处的信息环境。第二,传统的信息检索理论将检索结果分为相关和不相关,用检全率和检准率评价用户的检索效果[1],但实际情况是,当用户在面对大量的相关结果时,往往只有耐心去阅读其中的部分内容。这并不是因为其他信息不相关,而是因为这些信息与前面的信息有相重复的内容,后面的内容对用户的价值减少。其实用户也不清楚自己应何时停止在某一环境中继续觅食信息,因为他们往往不能确定自己能否在合适的时间内找到有价值的信息。当用户认为很难继续搜集到有价值的信息时,也就是说用户感到该环境中有价值的信息已经很少或需要花费很大的代价来获得时,他们就会停止信息觅食行为,或者转向另一个环境中继续搜索。

因此,与动物在自然界中的觅食行为类似,信息环境的结构在很大程度上影响着信息觅食人员的行为,对其起到决定性作用。在不确定的环境下,用户必须不断地评价期望的花费和期望的获益之间的关系,从而决定自己的信息觅食行为。Peter Ingwerson和Kalervo Jarvelin在《转折:在情境中集成信息查询与检索》一书中提供了一个与情境相关的整体主义认知观,反映了信息查寻和检索的认知观的进一步发展,提出了将信息环境和信息查寻行为作为一个整体来进行分析的思路[2]。

认知观可以帮助我们理解与情境相关联的用户认知过程,继而帮助我们研究认知行动者在不同认知下的特定行为。但认知模型在应用于信息觅食活动时也存在一些问题:在传统的认知模型中,信息查寻行为的花费和获益一直没有作为重点进行过研究,它们要么是被是被事先规定好的,要么就是不予考虑。此外,国内的研究主要是从认知的角度对用户的信息查寻行为进行分析[3~5],或者是通过各种调查(问卷调查,日志分析等)对用户的信息查寻行为进行分析[6]。这些研究更偏向于定性的研究,缺少定量的研究,多是基于对用户的信息查寻行为过程的理解之上的模型和概念,并没有从定量的角度通过数学建模等方式进行更深入的研究。而通过各种调查(问卷调查,日志分析等)对用户的信息查寻行为进行分析的论文虽然有一定的定量分析,但没有抽象出统一的模型,实验主要是对针对某一个具体领域的用户信息查寻行为的分析,缺乏对未来行为的预测和更广范围上的用户行为的描述和理解。因此,这些理论并不完全适用于真实网络环境中的信息觅食行为。

如果我们从认知的角度来看待用户的信息觅食过程,再结合信息检索及信息获取等相关理论,对于解释和研究用户的信息觅食行为会有比较好的效果。因此,我们很有必要对这些理论进一步深化和整合,这也正是信息觅食理论的特点和优势之所在。信息觅食理论从期望的花费和期望的获益之间的关系这个角度对用户的信息觅食行为进行系统分析,从而发现信息环境对信息觅食行为的影响,旨在详细研究信息环境,通过用户行为分析发现规律,建立相应模型,通过最优化分析模型预测用户的觅食策略,模拟和预测用户的行为,进而达到优化用户信息觅食行为的效果。

1.3 信息觅食理论的研究意义

现代的信息觅食者已经被我们自己所创造的海量信息所淹没。“信息爆炸和泛滥”使得人们在觅食信息时遇到了很大困难。虽然信息可以转化为知识,知识可以改变我们的能力,从而提高我们对复杂环境的适应能力,然而我们在复杂环境中的首要任务仍是先要获取相关的信息,通过信息分析后得到相关知识。信息环境本身的复杂性要求我们采用合适的信息觅食策略来获取信息。研究信息觅食的目的在于两个方面:解释并预测人们如何采取最优化策略来改变自己的行为以适应信息环境;如何构建最优化的信息环境以更好地为用户服务。

开展信息觅食理论研究的现实意义包括:

1)理解网络信息环境,从而优化网络信息环境。

2)为有关人们与信息交互方面的网络信息环境设计提供一个评价和设计标准。例如,在万维网上觅食信息的更好的评价方法。

3)通过定性分析和定量分析的结合和模型的建立来分析网络信息环境,预测用户的行为,为用户提出优化其行为的建议。

本文希望基于信息觅食理论开发一些模型来对用户的行为进行一定程度的事先预测,而不仅仅是像当前大多数的模型那样主要是对已发现的行为进行事后分析。基于此,我们需要通过一些概念、工具和方法来建立具有相应预测能力的模型。

2 最优化觅食分析理论

2.1 基于思维适应性控制(ACT)理论的认知系统

Herbert Simon指出,组织并不是拥有完美信息和无限电脑资源的最优化机构,由于环境和生理能力的限制,组织需要适应[7]。生成系统模型(Production System Models)提供了一种结构化方法来表示人们认知和处理信息的过程:一方面,生成系统模型在心理学中使用计算机来模拟和展示人们处理信息的过程;另一方面,生成系统模型并不只用于计算机的模拟,它已经成为了一种建立在人类大脑基础上的关于基本信息处理结构的认知理论[8~10]。

本文采用的生成系统模型是Anderson等于20世纪80年代初期根据认知学习理论提出的思维适应性控制理论(Adaptive Control of Thought Theory,ACT)[9]。该方法强调高级思维的控制过程,试图揭示思维定向与思维转移的控制机制和控制原则。ACT理论认为,在每一个时间点,在目标记忆中,可能有很多个目标,但系统行为在某一个时刻只会专注于其中的一个目标,通过对目标记忆中的目标的操控,人们完成种种复杂的任务。

这种模型试图通过一系列规则来模拟决策过程。生成规则(Production Rules)用来代表ACT理论中知识的认知过程,将用户对环境的认识和相应的行为抽象成为相应的规则表达式。每一个过程的规则都可以用以下的式子来表达:

IF〈CONDITION〉,THEN〈ACTION〉

在ACT中,每一个生成规则都会有一些解释条件,这些条件包括在用户头脑中对目标信息与头脑中已存在的相关信息的匹配和对于这些相关信息和记忆的检索。由于较新的信息在头脑中的印象比较深刻,ACT的作用机理类似于下堆栈,最后存储的被最先检索到。因此,记忆中存储一个新的目标可以看做是将该目标存入栈中,检索行为可以看成是将目标从栈中取出。在下面的实验中我们系统化地给出了具体的生成规则实例。

图1 基于ACT理论的认知系统

图1展示了一个基于ACT理论的认知系统,从外界环境中获得的信息被编码存储在表述性记忆(Declarative Memory)中,控制认知行为的目标和子目标被存储在目标性记忆(Goal Memory)中。系统将产生式记忆中的生成规则(Production Rules)与表述性信息中的动态信息进行匹配,这些匹配的信息形成了冲突集合(Conflict Set)。用户通过冲突集合产生的规则实例来计算信息的可利用性,而评价是以信息线索(Information Scent)为度量标准的。信息线索可以看成是内容的简单的描述[11]。由于时间的关系,用户不可能浏览所有的信息,最常见信息线索体现为网络链接中的描述性文字和图片,用户通过这些信息线索推测和度量那些链接背后看不见的网页内容。因为用户通常使用一组简单的词语来描述和评价信息,在早期的目录式查询中,人们通过将信息抽象为相应的类名和子类名,以树状目录来查询信息。由于搜索引擎的出现,人们开始通过关键词的匹配来描述和检索信息。当浏览信息时,人们往往也只是先在信息中寻找自己感兴趣的那些点,而不会一开始就仔细地阅读全部内容。这些点也就是信息线索,用户也正是用这些点来评价信息的质量。随着检索的不断深入,用户不断计算和评价信息可利用的程度,从而对目标记忆和表述性记忆进行更新。对于图1中的扩散激活模型(Spreading Activation),我们可以这样理解:用户在表述性记忆中检索信息,并将信息抽象成概念。当一个概念被用户加工时,该概念结点就被激活。由于在用户的头脑中概念存在上下位关系,并且不同概念之间也存在相似的关系,因此当一个概念结点被激活后,与这个概念有联系的其他概念结点也被依次激活。激活的过程还在不断地向四周扩散,先扩散到与之直接连接的结点,再扩散到其他结点。并且由于用户在检索的过程中对问题的理解不断深入,对于信息线索的认识和评价也会产生一些新的想法,因此扩散激活模型也是一个动态的系统,不仅包括搜索过程,也包括决策和认知的过程。

2.2 最优化的信息觅食行为

研究信息觅食理论的目的是想指导用户在正确的时间,使用正确的知识,采取正确的行动。在信息大爆炸的时代,我们的精力显得越发不足,因此这种需求也就变得越发迫切。Simon指出,信息也是消耗性的,接受信息需要消耗我们的注意力,因此与信息的价值相比,我们的注意力显得相对匮乏,因为我们没有精力观察到更多的信息[12]。

根据California-Berkeley大学信息科学学院的调查表明,全球63亿人,平均每人每年产生800MB的记录信息[13]。在这个信息大爆炸的年代里,真正重要的问题是如何加快人们觅食信息的效率,以最快速度找到对人们真正有价值的信息。

在现代社会中,现代化的技术手段帮助人们高效地进行信息交互。培根曾说“知识就是力量”,而这种“力量”既可以通过掌握更好的知识而得以加强,也可以通过“廉价”地获取和应用知识而得以加强。对组织来说,其能力的改进表现为它可以预测并且控制环境从而解决它所遇到的问题;对个人来说,其能力的改进表现为他发现、感知、使用有价值信息的效率的提高。考虑到时间和精力的稀缺性,我们所希望的是在单位的消耗中收获到最大限度的知识[14]。我们可以将这种意愿表示为:

信息觅食理论认为,人们更期望采用的信息觅食策略是那些在单位成本中得到最大效益的信息觅食策略。人们使用技术的目的也是为了提高信息觅食的效率。

信息觅食理论假定信息被存储在不同的介质环境中,信息觅食者可采用很多方法在信息环境中进行觅食活动;考虑到不同用户的知识背景,他们在不同的信息源中获得有用信息的成本是不同的,但成为最佳的信息觅食者是大家一致追求的目标,上述公式提供了一个判断标准,即最佳的信息觅食者就是那些在与信息交互的单位成本中获得最大效益的人。

3 基于觅食理论的网络信息环境分析模型及实证分析

3.1 基于觅食理论的网络信息环境分析模型

基于上述内容,我们提出了一个基于觅食理论的网络信息环境分析模型。该模型主要分为以下3个部分:①任务和信息环境的分析。由于网络环境中的信息分布有一定规律,因此对任务和环境的分析有助于我们根据用户的目标和任务,将环境中的相关影响因素抽象为相关的数学模型。②用户信息觅食的分析。通过将用户的信息觅食行为抽象成为相应的生成规则,从而帮助我们更好地理解用户的信息觅食过程。③建立数学模型、设定相关参数来模拟相应情况。通过参数的变化,我们可以得出在不同情况下不同的觅食策略所得到的不同效果,从而使得模型具有一定的预测能力。

图2 基于觅食理论的网络信息环境分析模型

3.2 实证分析

该模型可以通过实验来加以和验证。在实验中,假设我们的任务是要去北京旅游,所以要在互联网上寻找一家优质价廉的旅店。我们的实验目的是要对信息搜集环境进行分析和预测,通过计算得出在本次实验的信息环境中随机点击链接后可预期节省的钱。我们通过GOOGLE搜索进入一家专门介绍旅店的网页(中国通用旅游,http://www.51766.com/),发现该网站可以提供一些简单的查询服务,但该网站只能将星级和价格中的一项按顺序排列。我们将旅店地点选为北京,将旅店级别设为2星,得到了一些检索结果。因为首页的介绍往往不能准确地描述出适合我们的房间价格,所以需要点击相应的链接信息从而获得相应旅店标准间的价格。我们的实验假定在相同星级、相同房型下价格是唯一评价标准,而用户希望在尽可能短的时间内找到合适的旅店。

实验分为以下几个步骤:

3.2.1 对任务和信息环境的分析

图3反映了对该网络搜索出来的符合条件的结果。横轴表示将旅店按照网页所提供列表的顺序进行的一组罗列,纵轴表示相应的旅店价格。从图中我们可以看出,价格随着浏览和点击的链接数量不断地上下波动。假设用户的任务是想找到价格尽可能低的旅店,从图4我们可以看出,随着用户的不断浏览,搜到的旅店的最低价格也在不断地下降。图5显示随着浏览的深入,所省的费用也是不断地增加,节省的金额可以看成是第一个浏览的价格(247)与目前的最低价格之间的差异。

3.2.2 信息觅食的生成规则分析

假定我们的记忆包括所有从网页上查询到的旅店的内容,目标是找到廉价的旅店,我们需要将新的信息搜集结果与已找到的最低价格进行比较,从而得出结果。表1显示了一个基于ACT理论的生成系统模型。

3.2.3 基于概率模型的分析

下面我们用概率模型展示一种以期望的代价找到较好的旅店的模型。旅店的价格-数量分布如图6所示。

从图6中我们可以发现,价格大致呈现出正态分布的趋势。其实,在网上出售的商品的价格基本上都可以模拟为某种形式的正态分布。根据我们已知的较少的样本,我们用最大似然估计法求出相关的参数。为了降低误差,我们选用ln(X)的正态分布来估计参数μ和σ。分布的概率密度可以表示为:

因为X的累积分布函数为F(x)=P(X≤x),我们可以定义P(X>y)=1-F(y),因此可以推出以下的式子:

对于我们的实验来说,当我们目前找到的最低价格是247时,点击到下一个更低价格的网页可能节省的钱的期望为S(247)=35.27。依此类推,算出S(208)=17.11,S(198)=13.54。从图3中我们可以看出,真实情况是,当目前的最低价格为247,208,198时,点击到下一个更低价格的网页可能节省的钱依次为247-218=29,208-198=10,198-188=10。实验结果表明,我们的模型虽然有一些偏差,但还是较好地反映了真实的情况。这些模型的意义在于,当样本量的数量非常大时,我们可以利用较小的样本估计出整体信息环境的趋势,然后根据自己的情况在合适的时候结束搜索。

我们可以根据上面的公式做出简单的预测,因为用户是否有耐心点击以下的网页取决于他所期待的节省的价格与实际得到的节省的价格之间的差距。当差距达到一定的阈值时,用户就会选择离开。我们可以通过问卷调查的方式得出不同用户继续点击网页所期待的收益(在本实验中为期待节省的价格),通过计算随机点击到下一个更低价格的网页后节省的钱的期望S[,m],可以预测出用户在何时停止继续点击该网站的相关网页。我们也可以对根据用户的个人要求(期望通过点击下一个网页所获得的收益),来优化用户的信息觅食策略(在何时停止搜索),以期望的代价找到较好的旅店,从而达到与信息交互的单位花费中获得最大化价值的信息的效果。

4 结论

文章通过对信息觅食理论的意义、相关分析模型及其实证分析的介绍,展现了一种不同于传统理论的思路方法。在传统理论模型缺乏定量分析的情况下,本文从一种全新的角度来展示和描述用户的信息觅食行为与所处的信息环境之间的关系。

信息觅食理论的意义在于:①信息觅食理论关注如何理解网络信息环境,以及如何优化网络信息环境。②信息觅食理论试图为网络信息环境设计提供一个评价和设计标准,例如在万维网上觅食信息的更好的评价方法。③通过定性分析和定量分析的结合和模型的建立来分析网络信息环境,预测用户的行为,为用户提出优化其行为的建议。

文章最后通过一个实验展示了信息觅食模型的一些核心思想和分析步骤:首先从认知的角度分析用户的信息觅食过程,接着通过对信息环境的分析,构建数学模型对其进行描述,并用模型展示了一种以期望的代价找到较好的旅店的方法。

信息觅食理论为网络环境下的信息查寻行为提供了一个新的研究路径和分析方法。虽然目前的研究还刚刚开始,但可以相信,该领域中仍有很多的研究课题有待继续深入探索。今后的研究中,还将对模型进行深层次的分析,对信息环境和用户的信息觅食行为进行更好的模拟,从而取得更好的预测效果。

收稿日期:2008年7月25日

标签:;  ;  ;  ;  ;  ;  

基于觅食理论的网络信息环境实证分析_用户研究论文
下载Doc文档

猜你喜欢