基于认知观的信息检索基础理论研究,本文主要内容关键词为:理论研究论文,认知论文,信息检索论文,基础论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
〔分类号〕G353
依据库恩(Kuhn)范式理论,贝尔金(Belkin)把情报学理论划分为物理范式和认知范式两大类。研究范式从系统驱动转向认知驱动意味着情报学对用户及其认知研究的深化。而信息检索作为情报学研究的核心内容之一,同样具有系统导向和用户认知导向两大发展阶段。情报学与信息检索发展的历史证明,离开对用户的研究而仅仅依靠技术不可能最终解决用户信息需求和利用问题。认知范式从认知视角研究信息检索参加者(包括信息生产者、信息处理者、信息检索者及信息用户)的认知结构、信息行为及人机交互、情境、多元表示等。从1977年德梅(Marc de Mey)首次提出认知观(Cognitive Viewpoint)概念至今,出现了众多的需要进行梳理和总结的研究成果,本文在认知观理论发展脉络的基础上探讨信息检索用户和认知研究的相关问题,试图给出一个相对系统的描述和解释。
1 认知信息检索的历史沿革
1.1 认知信息检索相关概念
1.1.1 认知观及认知信息检索 认知科学认为,人类具有感知、认识外界的认知能力,认知行为是人从外界环境获取信息、加工信息,调整自己行为适应环境的过程。认知理论应用到情报学(包括信息检索)领域即形成情报学(包括信息检索)的认知观。情报学中的认知观最早由德梅提出:“任何信息的处理,无论是知觉的或符号的,都是通过信息处理设备,由人的世界模型系统或概念体系实现的”[1]。对信息处理主体而言,德梅所说的概念体系是对世界的描述,即世界模型。世界模型由个人的认知结构组成,认知结构在特定情境中受到个人或组织的经验、教育等多种因素制约。
德梅认知观提出后即受到福尔曼(Forhmann)、霍兰德(Hjorland)、泰迦(Taija)等学者的批评。泰迦指出,其缺陷在于缺乏宏观社会视角和信息处理的社会文化背景,没有形成明确的问题概念化方法[2]。由此,在德梅认知观基础上融合社会认知维度形成社会认知观理论。社会认知观倾向于在社会文化、组织、工作任务情境中研究用户的认知结构、信息需求等方面。
社会认知观代表人物为英格沃森(Ingwersen),他与贾维林(Jrvelin)等提出了认知信息检索的概念,继而在研究交互式认知信息检索模型之时提出多元表示准则(The Principle of Polyrepresentation),进一步深化和拓展了社会认知观的情境理论,并在此基础上提出整合认知理论的信息检索研究模型,进一步丰富了社会认知观的概念内容。
认知信息检索发展历史并不长,目前还没有一个明确的定义。本文认为,认知信息检索是认知观和社会认知观/整合认知理论在信息检索中的应用,以认知科学方法研究信息检索者认知空间、信息检索系统的信息空间及交互界面,是与传统系统导向信息检索和用户导向信息检索相区别的检索范式。
1.1.2 相关性及情境 相关性(relevance)是认知信息检索研究的基本概念之一。就目前的信息检索系统和行为而言,可简单认为,相关性主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。关系、直觉、多维和动态是其特征。萨拉萨维克(Saracevic)以认知理论为基础提出信息检索相关性的5个层级:系统相关性、主题相关性、认知相关性、情境相关性、情感相关性[3]。考斯金(Cosijn)和英格沃森从社会和组织的感知与策略方面分析相关性的维度[4]。尽管相关性研究有待深化,但可以说相关性研究推动了认知信息检索的发展。
情境(context)是认知信息检索的另一个基本概念。认知信息检索研究把用户看作动态的变量,即用户是在其感知的工作任务和信息获取行为的情境中进行检索行为。情境是指包括检索者具有的知识结构、信息检索交互经验等内在的信息素养以及检索者所处时间、地点、社会文化、组织环境、工作任务等外部环境的集合。情境与检索所涉及的工作任务、动机、情感、偏好、系统以及领域相关,用户处在与其积累的经验、文化、组织等情境和当前检索交互的情境之中,产生认知层面的交互才是有效的信息检索交互。因此,可以说情境是影响检索者认知行为和检索效果的重要外部变量。
1.2 系统导向、用户导向与认知信息检索的分野与融合
英格沃森在其1992年出版的专著《信息检索交互》(Information Retrieval Interaction)中,把信息检索研究方法划分为三类:传统信息检索(即系统导向的信息检索)、用户导向的信息检索和信息检索交互的认知方法[5],这三个方法也映射着信息检索发展的三个阶段。
第一阶段,系统导向的信息检索是把用户需求作为常量,用户须按照系统的程序进行操作。它的核心要素是文本表征、系统对象和检索技术,形成严谨的信息检索系统,侧重于通过实验研究改进算法提高检索系统性能。系统导向的信息检索将计算机技术与检索技术融合取得了丰盛的成果,仍然是目前人们生产和使用的主要信息检索产品,但在用户和相关性方面的深化上遇到瓶颈。
第二阶段,用户导向的信息检索把用户由信息检索系统常量变为具有多种需求、信息行为的变量,从数理统计、社会调查等方法研究用户信息需求、查询和获取行为,代表人物有泰勒(Taylor)、霍温斯(Hewins)、斯宾克(Spink)等。
第三阶段,认知导向的信息检索主要研究信息检索过程中用户认知行为、影响因素及检索模型。认知信息检索在某些方面带有浓厚的用户导向范式色彩,但多数情报学家认为用户导向的信息检索与认知信息检索在研究内容和方法上存在区别。用户导向的信息检索是把用户作为客观对象,而认知导向的信息检索则是把用户作为信息吸收和利用的主体。
当然,认知导向与系统导向、用户导向的信息检索并不是完全割裂的,而是发展和继承的关系;同时,前者也不可能取代后者,在信息检索系统实际应用中三者应该是相互融合的,共同促进信息检索系统检索效率和质量的提高。
1.3 认知信息检索的理论研究历程
正如前文所述,信息检索发展初期主要以系统观为核心,到20世纪70年代,人们认识到系统观存在“过分关注系统,而缺乏用户研究”[6]的缺陷,系统导向的信息检索需要寻找新的突破口。与此同时,认知科学迅速兴起并被引入到情报学,给信息检索带来新的生机,产生了基于认知观的信息检索。本文认为,认知信息检索的理论研究经历了三次较为明显的历史阶段:认知观形成、认知观发展成熟、社会认知观和整合认知理论兴起阶段。
认知观形成阶段是指认知心理学应用于信息检索研究中的初始阶段。此时,认知观处于萌芽状态。1977年德梅、1978年贝尔金分别从认知角度分析信息的概念,德尔文(Dervin)以信息使用为核心提出意义构建理论等。可以说20世纪70年代是认知信息检索的理论研究的起始阶段,最大的贡献是将系统导向的信息检索中用户需求作为常量的假设转变为变量的假设。
20世纪80年代是认知观发展成熟时期。此时,德梅、德尔文、布鲁克斯(Brookes)、贝尔金、英格沃森等众多学者进一步丰富和发展在形成阶段提出的认知观理论,取得了一大批有影响的研究成果。认知观逐渐走向成熟,对于信息检索的影响为提出相关性、情境等概念,进一步深化用户作为变量的属性研究。
20世纪90年代进入社会认知观和整合认知理论阶段。认知观研究从个体信息行为转向社会整体信息传递过程。1995年霍兰德(Hjorland)和阿尔布兰森(Albrechtsen)发表《领域分析:情报学的新起点》,引入领域分析方法并以其作为社会认知方法的基础[7]。英格沃森在前人研究基础上提出将认知信息检索与系统导向信息检索进行融合的整合认知理论,推动认知观及社会认知观理论在信息检索理论研究与系统实现中的应用。
2 基于认知观的信息检索主要理论
认知信息检索是情报学认知观理论的应用领域之一。德梅的认知观概念为认知信息检索提供了基本假设:信息检索过程存在交互作用,信息传递与接受都存在知识结构的变化,并以改善知识结构为目标。信息检索的实质是用户认知结构的改善。下面针对相关理论和模型分别进行分析。
2.1 德尔文的意义构建理论
特定情境中的需求是用户信息检索行为产生的驱动力,而信息问题的解决需要进行意义的构建。1972年,德尔文等提出意义构建理论(Sense Making Theory)[8]。德尔文重点研究信息利用中用户的“意义构建”过程,建立“特定情境→(时/空)认知差异→信息使用”三阶段模式,可以描述为:用户信息需求存在于某一特定时空范围内,用户信息查找行为是在特定情境中进行的,断层是信息行为构建的意义即信息问题,需要建立沟通的桥梁才能出现满足用户需求的结果。如图1所示:
图1 德尔文的意义构建理论
德尔文主张用意义构建方法研究和理解用户、构建满足用户信息需求的系统。她的观点在20世纪末期不断发展,结合数据收集和分析技术,形成了对用户信息活动整体理解的比较成熟的理论,是推动认知信息检索的发展的最初理论基础。
2.2 贝尔金的ASK理论
信息检索研究离不开对用户知识状态、信息需求及其关系的研究。用户知识状态是贝尔金的重要研究方向,他于1982年提出“知识非常态理论”(Anomalous State of Knowledge,ASK),认为检索者的信息需求产生的原因是认为自身存在着知识非常态,但通常检索者不能准确描述这种状态[9],即用户的知识结构与其信息需求之间存在“鸿沟”,正因如此用户无法准确查找到其所需要的信息。
ASK理论认为信息需求是产生认知不确定性的原因。根据ASK理论,为了解用户知识状态,需要研究用户所处的情境(包括知识背景、经验等),加强与用户的沟通。ASK理论在认知观发展中具有承上启下的理论作用,是认知信息检索的理论基础之一。
2.3 威尔逊的信息行为模型
研究认知信息检索必须考虑到用户的信息行为。信息行为是与人类信息来源和渠道相关的主动或被动行为。20世纪80-90年代,英国学者威尔逊(Wilson)提出多个信息查找和检索行为模型。其中1996年的信息行为模型较具代表性,如图2所示[10]:
图2 威尔逊信息行为模型
信息行为模型的核心是信息需求和信息获取行为,实际上是用户针对信息需求的问题解决模型。人的行为离不开特定时空的情境,情境是人类信息需求产生的背景和环境。信息需求产生后,激发机制导致信息查询、利用行为,同时信息行为受到中介变量的影响。威尔逊在模型中提出了中介变量、激发机制、信息查找行为的概念,对用户信息检索行为的发生过程与机理具有较好的解释作用。其中,中介变量是指影响特定情境中个人的信息需求的变量,如心理方面、人口方面、人际关系和环境方面的影响要素。激发机制包含两个阶段:①信息用户由于特定情境产生信息需求,在工作、生活情境压力下是否产生信息查找行为;②在中介变量的影响下权衡内在风险/回报、追求自我实现的心理努力,最终在中介变量影响与激发机制作用下产生信息查找行为。信息查找行为包括注意和检索两种行为,而检索则经历被动检索、主动检索和持续检索三个不同层次。查找得到的信息被用户使用,并反馈到情境中。
2.4 萨拉萨维克的相关性层级模型
萨拉萨维克认为,信息检索的发展方向应该是在穆尔斯(Mooers)信息检索基础上增加用户交互和情境因素[3],并研究提出信息检索相关性的5个维度,分别是系统、主题、认知、情境和情感。其中,系统相关性通过算法实现,揭示查询请求与系统中信息标引的匹配程度;主题相关性揭示查询的主题与检出文献的主题间的关系;认知相关性揭示用户知识状态和信息需要与检索到的文献的关系;情境相关性揭示环境、任务、问题域与系统检出文本之间的关系;情感相关性则揭示用户的意图、目的和动机和系统检索到的文本间的关系。相关性5个层级的划分实质上为基于认知观的信息检索系统设计指明了方向和最高的标准——信息检索系统要满足用户认知需求,促进用户认知改善。
相关性的5个层级之间存在由系统导向到认知导向程度之间的递进关系,如图3所示:
图3 萨拉萨维克提出的相关性层级
也就是说系统相关性是相关性最低层级,也是最低要求;认知相关性、情境相关性和情感相关性是信息检索评价的高层,更深入检索者认知心理需求。在系统实现方面,传统的信息检索系统基本上是利用布尔模型、概率模型和向量空间模型等算法实现的,实质是按照关键词词频确定权重进行词的字面匹配运算,只能完成系统相关性要求。对于主题相关性,采用关键词匹配的一些系统也可以部分实现,但由于标引等问题,关键词的匹配并不意味着主题相关性,也不意味着认知相关性及以上层次的相关性。因此,实践中,信息检索相关性问题仅仅在最底层的相关性层次得到实现,认知、情境与情感相关性并没有得到很好解决。
2.5 英格沃森的认知观理论
英格沃森认知理论受到布鲁克斯知识方程和贝尔金ASK理论的影响,其理论贡献主要体现在如下方面:
●潜在信息(Potential Information,PI)。英格沃森在《信息检索交互》中引入“潜在信息”概念。PI是信息理解与交流过程中产生的新信息,对信息接收者(包括处于不确定状态的信息接收者)的认知是潜在的。英格沃森在布鲁克斯知识方程的基础上提出新的认知方程:
PI→δI+K(S)→K(S+δS)→PI’
该方程假设信息接收者感知潜在信息。其中,PI是信息接收者对δI的感知,δI受到真实的知识状态(包括问题域和不确定性状态)K(S)影响。上述作用将K(S)转化为新的知识状态K(S+δS)。知识状态转变创造的信息对其他信息接受者是新的潜在信息PI’。
●五维度。英格沃森在贝尔金指出的情报学5个领域基础上提出5个维度的概念,包括处理正式信息与非正式信息的交流、社会内部及个人信息需求的产生和发展、信息系统研究方法和技术、知识创造和信息系统表达方式、相关性和信息价值五个领域,如图4所示(5个领域分别用数字表示):
图4 英格沃森5维度模型
提出五维度的英格沃森已经开始关注用户信息需求产生与外界的关系以及信息检索交互过程中用户所处的不同社会内部环境的影响。
●认知信息检索交互模型。1996年,英格沃森形成认知信息检索交互理论[11],他在《信息检索交互的认知观:认知理论的要素》一文中引入信息空间多元表示概念。多元表示概念描述用户当前的信息需求、问题状态与领域工作任务或兴趣结构之间的因果关系。信息检索中全部交互活动和信息查找都可以视为认知过程,认知行为在全部信息处理要素中均有体现。英格沃森在特德(Turtle)和克劳夫特(Croft)信息空间网络模型的基础上整合用户认知空间的描述和界面功能,建立了如图5所示的多元表示的全局模型。
信息检索多元表示全局模型由3部分构成:用户的认知空间、系统的信息空间和用户查询的交互界面。用户认知空间的多元表示要素垂直排列、自下到上显示了信息需求产生的原因及过程。认知空间的多元表示包含用户认知结构、检索交互经验、知识状态、问题域、信息需求等方面。
图5 信息检索多元表示全局模型
2.6 霍兰德的领域分析框架
1995年,丹麦学者霍兰德与阿尔布兰森为解决认知观中社会维度缺失的问题,将领域分析方法引入进来,并把领域分析范式作为学科的基本理论[7]。领域分析方法主要是从社会角度理解用户信息需求、行业或学科的信息系统功能。霍兰德认为领域分析是一个认识论的框架,是知识组织、知识结构、合作模式、语言交流形式、信息系统和相关性标准在社会信息交流及其角色中的反应。2002年,霍兰德描述了领域分析的11种方法[12],主要包括文献规则和主题,分类,信息标引,经验用户知识,文献计量,信息结构和服务的历史研究,文献类型研究,不同范式、假设的认识论和批判研究,语言和知识领域研究,交流结果和机构知识研究,认知、知识表示研究等。可以说,领域分析方法将信息作为一种社会现象,以社会研究方法结合领域分析方法研究信息需求、处理和利用问题。
2.7 整合认知理论
2005年,英格沃森和贾维林在《转折:情境中的信息查询与检索》中对传统认知观进行修正,提出整体认知理论(Holistic Cognitive Theory)的概念[13]。2008年,他们在《论信息检索的整合认知理论》中在扩展系统导向信息检索模型的同时,把整体认知理论改为整合认知理论(Integrated Cognitive Theory)[14]。
整合认知理论是在系统导向的信息检索界面基础上增加社会文化、组织情境,用户信息检索是在特定的信息查找、工作任务过程、与工作相关或不相关的情境中进行的,在图6左侧的2个要素中体现:
图6 英格沃森信息检索整合框架
信息处理发生在信源与信宿之间的不同水平上,认知参加者的信息交流受到过去和现在的经验及社会、组织、文化环境影响。因此,信息传递和交流总是在特定情境中的进行的。在信息检索整合框架的6个要素中,认知参加者要素可以细分为:参加者类型、感知的工作任务、感知的检索认知3个子要素。这样,图6的信息检索整合框架增加至9个维度。这9个维度可以分为3类:社会组织任务维度(包括自然工作任务维、自然检索任务维2个维度)、参加者维度(包括参加者特征维、感知工作任务维、感知检索任务维、文献维4个维度)、算法维度(包括算法搜索引擎维、算法接口维、获取和交互维3个维度)。该框架实际上是认知信息检索与系统导向信息检索的整合,为基于认知理论的信息检索系统研究提供理论依据。
3 基于整合认知理论的信息检索系统
基于整合认知理论的信息检索系统是以计算机为物质基础,利用认知理论设计具有智能化检索功能的人机交互检索系统。这样的信息检索系统具有更加符合用户认知行为特征、与用户信息需求相关度更高、用户为中心、人机交互等优势,对信息检索系统理论研究、开发与设计、用户服务等具有重要的指导价值。
近年来,信息检索出现很多新的发展趋势,如跨语言信息检索、语义信息检索、基于本体的检索等,但是多数的信息检索系统仍然利用传统信息检索模型,即布尔模型、向量空间模型和概率模型及其改进模型作为算法基础。其中向量空间模型在系统导向的信息检索系统中占据主导地位。可以说系统导向的信息检索并没有退出信息检索实践领域,相反仍然占据信息检索系统的核心领域;认知信息检索理论和模型仍处于发展的初期。但也应看到,认知观理论给情报学、信息检索理论研究提供新的角度,揭示出信息检索绝对不仅是一种简单的物理或机械式的匹配活动,更需要从用户认知视角建立整合认知理论的信息检索模型。而且,随着认知科学、人工智能和专家系统的发展,存在突破系统范式真正建立认知检索系统的可能和具体的实现方案。
整合认知信息检索系统的实现需要长期的发展过程。目前的突破是在系统导向信息检索模型基础上,在模型设计、系统构建、检索交互中增加认知维度和社会认知维度的情境要素。英格沃森提出的嵌入情境和评估标准的信息检索模型,可以看做是整合认知理论信息检索模型的雏形,如图7所示:
图7 嵌入情境的信息检索模型
信息用户在特定的社会组织文化情境、工作任务情境、查找任务中根据特定的工作任务或兴趣,并针对特定的信息检索情境进行信息查找和获取行为。该信息检索模型实际上是整合认知信息检索与系统导向信息检索模型的综合,是基于认知观的信息检索模型系统实现的初步尝试。
4 结论和展望
信息检索的最高目标是支持人类通过更好地获取信息而完成特定的工作任务。认知理论为信息检索发展提供了新的思路和方法。由于认知信息检索理论引入检索者认知变量并具有人性价值理念的优势,更加符合人类信息检索行为认知过程的实际情况,因此认知信息检索具有良好的发展前景。但是,不可否认,认知信息检索系统尚处于理论观念的革新和系统模型构建阶段。未来认知信息检索的发展,还需要与系统主导信息检索系统模型进行融合,才能真正实现认知信息检索模型在实际系统中的应用。
收稿日期:2010-06-10修回日期:2010-08-30
标签:信息检索论文; 情报学论文; 认知理论论文; 认知发展理论论文; 用户研究论文; 认知过程论文; 用户需求论文; 空间维度论文;