基于根理论的合作信息检索行为案例研究_大数据论文

扎根理论视角下合作信息查寻与检索行为的案例研究,本文主要内容关键词为:合作信息论文,视角论文,案例论文,理论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[分类号]G254.9 DOI:10.7536/j.issn.0252-3116.2013.19.003

修回日期:2013-09-20

1 问题提出

用户行为研究作为合作信息查寻与检索(Collaborative Information Seeking & Retrieval,CIS&R)领域的重要内容已经受到广泛重视,但本土环境下的研究仍相当缺失[1]。合作信息查寻与检索的行为研究亟待解决以下一些问题:合作信息查寻与检索行为与单用户的行为相比有哪些显著性的差异?其行为特征与规律是什么?群体的相关性判断是如何展开的?受到哪些因素影响?群体查寻与检索的收敛准则是什么?等等。这些问题的解决不仅有利于深入理解合作信息查寻与检索本身,而且对于合作检索系统开发具有非常重要的现实意义。本文将以扎根理论为指导,通过对现实案例的详细考察来探讨合作信息查寻与检索的行为特征、相关性判断及影响因素等问题。

2 研究方法

本研究期望通过真实信息需求合作查寻检索过程的深入解析来探索其行为特征、相关性判断及影响因素,因而根据需要选择了两种方法:获取数据用案例研究方法,分析数据用扎根理论方法。

案例研究作为一种实证研究,在不脱离现实生活环境的情况下研究当前正在发生、发展的现象,且待研究的现象与其所处环境之间的界限并不十分明显。因此,案例研究是描述难以从所处语境中分离出来的现象时宜采用的研究方法[2]。CIS&R通常是在一定语境下的群体用户共同解决问题的过程,因而研究CIS&R行为特征必须考虑到与语境要素的相互作用,由此可以认为本研究适合采用案例研究方法。考虑到语境中行为的丰富性与复杂性,在案例研究过程中应不限于行为数据本身,还应尽量获取真实的语境因素信息。

扎根理论方法主要是建立严格的来源于资料的归纳式理论,而不是立足于假设检验的演绎式理论,所以扎根理论是一种适合于探索型研究和解释型研究的方法。当碰到以下情况时,研究者可以考虑使用扎根理论:对研究主题范围所知相对较少;没有“大”理论来充分说明所研究内容;研究者打算挑战现有理论;研究者对引出研究对象的理解、知觉和体验感兴趣;研究指向于发展新的理论[3]。本研究不仅仅是为了描述合作信息查寻与检索的行为与过程,更旨在探索其背后的机制、解释其中的规律和构建模型,因而选择扎根理论方法自下而上来开展数据分析是合适的。

3 研究过程

3.1 研究方案设计

3.1.1 CIS&R活动开展前 从姓名、年龄、专业、信息检索能力、群体间熟悉程度等方面设计“个体及群体基本信息调查表”,招募到研究对象后,通过要求他们填写该调查表来深入掌握研究对象及其背景。为了有效挖掘真实的信息检索需求与信息查寻检索语境,通过与研究对象交谈来挖掘其真实生活、学习、工作或其他问题,从而确定合作信息查寻与检索任务。

3.1.2 CIS&R活动开展中 确定CIS&R任务后,在研究对象查寻与检索信息的过程中,一方面利用屏幕录制软件记录他们在计算机上的具体操作活动,并利用设计的“合作信息、查寻与检索行为过程观察表”观察并记录CIS&R活动的具体场所、用户的非计算机操作行为等;另一方面采用出声思维法,要求研究对象在操作时阐释自己的想法,同时对研究对象合作查寻与检索过程的交谈或讨论情形等进行录音。

3.1.3 CIS&R活动结束后 为了进一步补充观察、屏幕记录、出声思维与交谈讨论录音的不足,在研究对象的信息查寻与检索活动结束后要求他们填写一份“合作信息查寻与检索及相关性判断报告”。另外,研究人员利用设计的“合作信息查寻与检索行为访谈提纲”对前述过程中发现的一些问题进行深度访谈,一方面为了弥补观察与出声思维过程中可能的遗漏,保证数据的完整性与可靠性,另一方面可以相互印证这些数据,确保数据的真实性。

对于收集到的数据,可通过转录、誊写等预处理将其全部转化为文本,再经过扎根理论方法多轮迭代编码,分析群体用户在合作查寻与检索信息过程中的行为,尤其是相关性判断行为特征、机制、影响因素、使用判据等。

3.2 数据搜集

出于方便性考虑,本研究的招募对象全部为在读高校学生,共计13人。其中:男性3人,女性10人;本科生9人,硕士研究生4人;毕业班学生9人(案例1、2、3),非毕业班学生4人(案例4、5);年龄分布在18-25岁;涉及食品科学、植物保护、化学、物理、广播电视编导、思想政治教育等专业。其个人基本信息见表1。

通过与研究对象交谈挖掘其当下所面临的真实的生活或学习问题,确定其实际信息需求,由此制定CIS&R活动任务。最终,5组研究对象均以其所面临的日常生活问题或学习任务来展开CIS&R活动,其合作查寻与检索的主题内容见表2。

为了让研究对象比较自在地展开合作查寻与检索行为,只要条件许可,都在他们比较熟悉的环境(如寝室或自习室)展开活动;对于条件不具备的情境,则在研究实验室中展开。

首先由各研究对象填写“个体及群体基本信息调查表”;同时,在研究对象的个人计算机上安装“屏幕录制专家2011”软件或告之实验计算机上安装有屏幕录制软件。在培训研究对象如何使用屏幕录制软件与出声思维法后,正式开始查寻活动,通过屏幕录制软件记录研究对象的操作过程,并用录音笔记录研究对象的出声独白与对话。在研究对象开展查寻活动的过程中,研究人员依据事先设计的“合作信息查寻与检索活动观察记录表”,观察并记录研究对象的非计算机操作活动、查寻活动现场环境等。

合作查寻与检索活动何时结束由研究对象决定。在CIS&R活动正式结束后,研究人员根据对研究对象的了解和对查寻过程的观察记录,对研究对象展开群体性的半结构化访谈,并对访谈进行录音。考虑5组研究对象开展合作查寻与检索活动形式存在差异,当CIS&R活动成员各自使用单独的计算机开展查寻活动时,由其单独填写“合作信息查寻与检索及其相关性判断报告(个人)”;而CIS&R活动成员共用一台计算机时,则请其填写“合作信息查寻与检索及其相关性判断报告(集体)”。

3.3 数据分析

5组案例收集到的数据包括手写笔记、电子文本、音频、视频4种形式,共计有效“个体及群体基本信息调查表”13份,纸质观察记录5份,屏幕录制视频13段,现场出声思维与交谈录音音频8段,群体访谈录音音频5段,有效“合作信息查寻与检索及相关性判断报告”11份,共计视频640分钟、音频394分钟。将纸质观察记录全部录入计算机,借助于QSR Nvivo 8软件将所有的音频与视频数据转录为文本,最终全部文本资料共计9万余字。

扎根理论在其发展过程中吸引了不同领域的研究者,使其成为社会科学较常使用的研究方法之一。目前有三种主要的扎根理论方法:B.Glaser与A.Strauss的原始理论、A.Strauss与J.Corbin的程序化理论和K.Charmaz的建构扎根理论[3]。基于理论构建的需要,本研究更倾向于引用建构主义扎根理论。

K.Charmaz给出了建构主义扎根理论过程的主要环节[4]:①数据收集,即使用不同的数据收集方法,所收集的数据充分且具有丰富的细节,并将其放在相关的情境与社会背景之中;②数据编码,主要包括研究人员对数据进行解析并开始概念化的初始编码与对大量数据进行区别、分类并将分解后重新综合的聚焦编码;③撰写备忘录,即对编码过程与编码内容的分析笔记进行分类、整合(必要时可以以图表的形式整合想法、梳理逻辑),从而将代码提炼为概念类属,为理论建构做准备;④撰写草稿,即通过对草稿的不断修改,建构具有说服力的论点,检验类属,判断、解释核心类属。

K.Charmaz认为对于有着丰富细节、与基本经验问题或过程有关的数据来说,逐行编码会发挥特别好的作用。但逐行编码会产生太多的类属与属性,造成过度概念化的狼狈[4]。因此,本文在初始编码时采用了“以逐行编码为主,以逐个事件为辅”的数据编码原则。在具体初始编码过程中,使用了“提问题”和“不断比较的方法”(constant comparative methods)。其中,所提问题诸如这些数据是关于什么的研究、这些数据表明了什么、是谁的观点、这一具体数据指向哪个理论类属等,以使编码紧密结合数据;而“不断比较的方法”则包括诸如事件与事件的比较、概念与事件的比较、概念与概念的比较等。

在初始编码的基础上,通过与数据的对比筛选初始代码,选用那些最为重要和频繁出现的初始代码进行聚焦编码,进一步提高编码的指向性和概念化程度。同时,不断撰写关于数据、编码的备忘录,分析归纳数据中所蕴含的概念范畴。通过撰写、整理备忘录,将编码提升为概念与范畴,开始进行理论建构,探索合作信息查寻与检索的行为特征、相关性判断影响因素与过程机制等问题。

4 研究结果

4.1 总体结果

采用扎根理论方法,最终共获得现象定义1297个,初始编码660个,聚焦编码74个;通过撰写备忘录最终将编码提升为17个主要概念范畴(见表3),每个范畴有其子范畴,部分子范畴又被分解为几个次级子范畴。这17个概念范畴分别为:查寻者个体、合作查寻者群体、实际任务、合作信息查寻与检索任务、合作信息查寻与检索动因、合作查寻与检索信息、合作信息查寻结果、合作分工、合作相关性判断、信息交互、查寻反馈、信息浏览、信息保存、合作问题解决、求助团队以外人员、合作信息查寻与检索效应及干扰因素。

将这17个概念范畴进一步聚焦,可以提升为5个核心范畴:查寻者、实际任务、CIS&R任务、CIS&R过程与结果和合作问题解决。仔细分析这5个核心范畴可建构如下关系:在一定的语境中,在实际任务的驱动下引发了查寻者的合作信息查寻与检索任务,查寻者通过合作信息查寻与检索过程以及获得的查寻结果提出问题解决方案,完成实际任务。其中,查寻者是CIS&R活动的内在驱动力,其他4个概念范畴以查寻者及其群体为中心,即几个范畴之间的相互作用均是通过查寻者实现的。如图1所示。

图1 核心概念范畴间的关系框架

扎根理论并未把语境作为一个单独的概念范畴析分出来,而是分散于其他范畴之中的。有学者指出,用户信息查寻行为是在特定的社会语境下产生的,这种社会语境是由社会组织文化语境、工作任务语境、查寻任务语境、用户知识结构语境等嵌套而成的[5]。基于对CIS&R案例数据的扎根分析,图1中的语境主要是由处于社会文化这一大环境中的查寻者语境、实际任务语境、CIS&R任务语境以及合作查寻与检索活动的具体执行环境(物理环境、信息环境)等组成。查寻者、任务、查寻与检索活动一方面受语境的影响,另一方面它们也是语境的重要组成部分。

4.2 案例的对比研究结果

对5个案例在主体层面、行为层面及语境层面进行详细对比,尤其是事件与事件、概念与事件、概念与概念之间的比较后,可以发现以下一些事实:

4.2.1 查寻群体是否有过CIS&R经验对本次查寻活动的影响并不明显 通过案例间的对比发现,无论是如案例1之前无合作经验或是如案例3的高频合作,在行为层面的不同之处并不明显。

4.2.2 没有等级的群体结构、平等的合作关系对CIS&R活动中的信息交流有一定的促进作用 研究中发现,几个案例中查寻者之间的信息交流频繁、顺畅,笔者分析认为这一方面是由于查寻者之间较为亲密的社会关系造成的;另一方面可能是每一个合作群体平等的群体结构降低了信息交流的障碍,合作者相互平等的关系使得这种信息交流是一种平行的信息交流,提高了信息交流的效率。

4.2.3 CIS&R行为之间存在一定的相互影响 如分工方式的不同会影响到查寻途径的使用,“共享电脑型”CIS&R行为通常由一人执行具体操作,在同一时刻只使用一种查寻途径,而“并行电脑式”CIS&R活动若采用分工方式,则可能多个查寻者在同一时刻使用多种查寻途径;使用不同的查寻途径,可能造成查寻者获得的查寻结果不一致,而共用一台电脑仅由一人执行操作则仅出现一种查寻结果,不存在多用户查寻结果不一致的情况。由于查寻者获得的查寻结果可能存在差异,且查寻者使用的相关性判断也各不相同,会造成查寻者之间在相关性判断上表现不一致。此外,信息交流方式的不同会影响到查寻者之间共享信息的效率与效果,共享屏幕甚至直接操作合作者的电脑,所能传递的信息量远大于同一时间内的口头交谈,而信息交流则对整个CIS&R活动过程起着重要作用。

4.2.4 语境(实际任务语境与CIS&R任务语境)对合作分工方式、查寻途径、信息交流方式等有一定影响 实际任务性质的不同直接决定了CIS&R任务的类型,而物理空间的布局、设备设施的使用进一步影响了查寻者开展CIS&R活动的方式。本研究中几个案例所涉及的任务主题均适宜采用网络搜索的方式获取所需信息,任务主题的具体内容对于选择具体的查寻途径(如选用综合搜索引擎还是学术数据库)则起到了关键作用。可以使用的电脑数量一方面决定了查寻者分工的方式,如一人操作还是大家同时开展查寻;另一方面也限制了信息交流的方式,共同使用一台计算机的查寻者除了能够口头交流外,还可以直接实时地、全程地分享屏幕内容,很大程度上减少了对查寻结果内容的复述,更多的是对信息相关性、适用性的讨论。此外共享计算机屏幕也在一定程度上减少了口头交流过程中的信息失真与错误问题,如在案例3中查寻机票价格时误将网页中“北京”视为“北海”并将查寻结果告知其他成员。

4.3 合作信息查寻与检索相关性判断的影响因素

根据扎根理论析出的概念范畴,可以聚焦出5类合作信息查寻与检索相关性判断的影响因素:查寻者个体与群体、CIS&R任务、合作查寻结果、语境和相关性判断表达与交流。其中,CIS&R任务与合作查寻结果作为相关性关系的两端,决定了相关性本身,从而影响相关性判断行为;查寻者作为做出判断的主体,不同的个体给出的判断意见存在差异,群体结构也在一定程度上影响其达成一致性意见的水平;而语境与相关性判断表达与交流则更多影响相关性判断的一致性。

4.3.1 查寻者个体与群体 对于查寻者个体而言,影响因素主要包括其信息查寻习惯、信息查寻与检索经验、领域知识及诸如性别、年龄等个人背景;作为一个群体,该群体的结构、查寻者之间的合作关系、查寻者不同的角色或身份等均对相关性判断有一定影响。此外,影响因素还包括查寻者的合作分工。

查寻者个体之间的差异,特别是领域知识的差异影响着查寻者对实际任务、信息查寻与检索任务以及查寻结果的认知,进而造成不同查寻者在相关性判断上的差异;而查寻者在群体中的合作关系、角色扮演、劳动分工的不同,影响了查寻者群体对相关性判断一致性的处理,比如当查寻者以“帮助者”的身份出现时,更倾向于听取由问题“求助者”做出的相关性判断意见,而以同一任务成员身份出现的查寻者们则要求相关性判断得到多数人的赞同甚至是所有人的一致意见。特别是以分工方式开展CIS&R活动时,这种对相关性判断达成共识的需求更为强烈。此外,查寻者对自己检索能力的评估在一定意义上代表了对自己信息查寻与检索知识的自我认知与预期,自我效能感评估水平的高低也会影响在CIS&R过程中对相关性判断意见的表达。

4.3.2 CIS&R任务 指在实际任务驱动下,查寻者产生信息需求、查寻方向和信息提问,CIS&R任务的这三个层次再加上查寻者使用的检索表达式,非常接近于S.Mizzaro定义的信息需求的4个层次[6]。查寻者对于问题或需求的理解处于不同层次时,对于相关性的理解与处理有较大差异:如仅考虑查寻到的信息与检索表达式的匹配时,查寻者做出的是语法相关性判断,而如果考虑的是该信息与感知到的信息需求之间的一致性时,则是一种语用相关性的判断。

4.3.3 查寻结果 包括查寻者通过与信息检索系统交互获得的结果,还包括其他查寻者所分享与交流的查寻结果以及求助团队以外人员获得的信息。由于查寻结果数量的增多,查寻者在选择信息时通常是做最优选择,因此,其对相关性做出的判断是相对的,即相对于其他信息而言某信息是相关的,如果未能获得该信息,其他信息或许会判断为相关。这是一种相对相关性,而非绝对相关性。

4.3.4 语境 主要由实际任务语境和CIS&R任务语境组成,实际任务语境基本决定了CIS&R活动的具体任务语境。本研究的案例中,在日常生活问题与学习任务引发的信息查寻行为中,查寻者会选用截然不同的相关性判据,如案例5中的查寻者很少会像案例4中那样考虑页面的布局,而是更加关注主题是否相关;并行电脑式CIS&R较共用电脑式CIS&R而言,由于信息共享的程度较低,在达成一致的相关性判断意见时,需要花费更多的交流与讨论时间。

4.3.5 相关性判断的表达与交流 案例实践表明:查寻者对相关性的表达有时仅仅是简单的“好”与“不好”,有时则较为复杂;查寻者基于相关性判断的交流可以分为询问、回应和争辩。当相关性判断比较简单时,查寻者对于某信息是否相关有着明确的一致性意见;而如果查寻者需要通过交流甚至讨论来理解、判断查寻结果的相关性时,查寻者间很可能对该信息的相关性持有不同意见,这时查寻者通常需要就相关性判断做出妥协性决策。

据此,笔者构建了合作信息查寻与检索的相关性判断过程模型(见图2)。该模型是对CIS&R过程模型中合作相关性判断环节的细化(见图2中间部分),模型中合作相关性判断受实际任务或问题驱动(见图2左侧部分),目的是为了解决问题(见图2右侧部分)。

图2 CIS&R的相关性判断过程模型

CIS&R的相关性判断过程模型以CIS&R相关性判据为内核,以相关性判断行为特征与影响因素为外壳,强调了合作相关性判断在交流、认知和决策三个层面的特征,并揭示了影响合作相关性判断的重要因素。

CIS&R活动中,相关性判断的主体是查寻者群体,客体是CIS&R任务、合作查寻结果及其之间的相关性。其中相关性是CIS&R任务与合作查寻结果在相关性判据集合上的映射关系,这种关系取决于查寻者群体对相关性判据集合的选用,并随时间的推移而动态变化。

在交流、认知和决策的共同作用下,群体达成了相关性判断的共识。其中,认知主要是查寻者对CIS&R任务和查寻结果的理解与认识,而查寻者间交流的主要内容有CIS&R任务(包括信息需求、查寻方向、提问、检索式等)、查寻结果以及对查寻结果的相关性判断意见和使用的具体判据,决策则是查寻者在交流和认知的基础上,对相关性判据(集合)的选用及CIS&R任务与合作查寻结果在该判据上的映射关系作出的判断,最终形成具有妥协一致性的相关性判断意见。

模型中,查寻者(群体)、CIS&R任务与合作查寻结果三个影响因素分别是合作相关性判断的主体与客体。而另外两个相关性判断的影响因素中,语境因素并未显式地表达出来,可以认为语境是一个隐性的背景式影响因素,同时也可以将模型中的各个部分均视为语境的组成部分;而相关性判断表达与交流这一影响因素则隐含在交流之中,是个体知识结构在群体语境中协商式共识的形成基础。

5 结语

本研究采用出声思维、观察、访谈等多种方法收集了5个案例的数据,这些数据彰显了真实信息需求语境下群体用户的合作信息查寻与检索行为特征,通过扎根理论的初始编码、聚焦编码与理论编码等过程与案例对比方法对这些数据展开分析,主要有以下结论:

·合作查寻与检索行为中蕴含有17个主要概念范畴,并可进一步聚焦为5个核心范畴:查寻者、实际任务、CIS&R任务、CIS&R过程与结果和合作问题解决。其中,查寻者及其形成的群体结构是CIS&R过程的内在驱动力,其他4个概念范畴以查寻者及其群体结构为中心,范畴之间的相互作用通过查寻过程来实现。

·从主体、语境与行为三个层面进行案例对比研究发现:有无合作查寻与检索经验对CIS&R行为无明显影响;平等的合作关系对CIS&R行为有一定促进作用;语境直接影响CIS&R活动中的合作分工、人机交互与信息交流方式。

·合作信息查寻与检索过程具有任务驱动、语境约束、动态迭代、合作分工与信息交流等属性特征。其中,合作相关性判断处于核心地位,衔接了CIS&R活动的各个环节,并推动查寻与检索活动的动态变化。

·合作相关性判断包括查寻者的相关性判断行为与结果、所使用的相关性判据、相关性判断一致性和基于相关性判断的交流几个子范畴。CIS&R的相关性可视为CIS&R任务与合作查寻结果之间的一种映射关系;合作相关性判据与传统单用户相关性判据差异不大,用户间信息交流是合作信息查寻与检索区别于个体查寻与检索的显著性特征;CIS&R相关性判断受合作语境支配,它通过交流实现个体知识结构在群体语境中的妥协,并为相关性判据选择提供基本约束变量。

由于各方面的限制,本研究还存在以下一些问题:研究案例以用户的同时同地CIS&R活动为主,未能获取用户的同时异地、异时同地、异时异地形式的CIS&R行为数据,因此CIS&R活动形式的差异是否对用户行为有影响需要做进一步检验;样本数据采集对象局限为高校学生,需要扩充样本范围做进一步探索;研究中仅指出了影响群体用户合作相关性判断的5种主要因素以及用户在CIS&R中采用的相关性判据,但是未能进一步研究每种影响因素对合作相关性判断行为的影响程度,也未能阐明不同类别的相关性判据在合作相关性判断活动的权重。

今后研究中还应注意以下问题:广阔语境层面下群体CIS&R的行为特征;相关性判断影响因素的相互作用关系及量化模型;如何在信息检索系统的设计与实施中应用合作相关研究成果等。

标签:;  ;  ;  ;  ;  ;  ;  ;  

基于根理论的合作信息检索行为案例研究_大数据论文
下载Doc文档

猜你喜欢