近百年来文本阅读研究述评_信息加工理论论文

近百年来文本阅读研究述评_信息加工理论论文

文本阅读研究百年回顾,本文主要内容关键词为:文本论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:B84;G442 文献标识码:A 文章编号:1000—5455(2006)05—0128—13

一、文本阅读研究的早期起源

文本阅读是人类独有的一种认知活动,也是人们获取信息的重要途径之一。文本阅读研究不仅有助于揭示人类认知活动的本质和规律,还可以为中小学阅读教学实践提供指导,为机器阅读、人工智能等技术的发展提供心理学基础,促进心理学、教育学和认知科学等学科的发展。因此,文本阅读研究,既有重要的理论和学术意义,也有重要的实践和应用价值。对文本阅读中有关信息的理解和加工一直是阅读心理研究的核心内容,是心理学界十分重视和关注的重要课题。

1879年冯特在德国莱比锡大学建立了世界上第一个心理学实验室,标志着科学心理学的正式诞生,而阅读的实验研究也由此开始。虽然冯特的学生卡特尔被公认为是早期对阅读进行实验研究的中心人物,但从文本阅读研究的历史发展来看,对文本阅读理解问题最早进行研究的是Romances。Romances在1884年就报告了第一个关于文本阅读理解的研究,他在研究中要求成年人在一定的时间之内阅读一段有10行文字的文章,读完以后要求他们写下能够记起的一切。Romances发现,被试在阅读速度方面差异很大,并且读的快的被试回忆得也多。他还发现,虽然被试在第一次阅读之后回忆一般是不完全的,但是在第二次阅读之后,许多在第一次阅读后没有回忆起来的项目在再认判断时立刻被认定为是“熟悉的”。Romances把这种再认和回忆之间的差异归之为“思想的潜伏”。

虽然由于各种原因,早期阅读研究中对文本水平的关注远远比不上对字词水平的关注,但Romances的研究在一定程度上启发了人们对文本阅读研究的关注,其后不断有研究者开展了对文本阅读理解的研究。其中Bartlett在1932年的研究被公认为是实验心理学中第一个严格的文本阅读的认知研究。在Bartlett的研究中,他让20个被试阅读8篇内容不同的短文两遍,阅读之后,相隔一定的时间, 让被试回忆他所阅读的材料。阅读和回忆的时间间隔有长短不同的变化,短的只有两周,而长的近10年。结果发现,被试回忆出来的情节和原有故事情节有很大变化,主要表现在:(1)简约化,丢掉了许多细节,很难回忆故事中的原词原句, 只留下一些语义在头脑中。(2)突出化,少数突出的细节留在头脑中,并可能过分强调。(3)合理化,使情节变得更加前后一致, 更符合个人的经验。 对于实验结果,Bartlett用图式(schema)的概念进行了解释。他认为,图式是一种对过去反应的积极的组织,也可称为是过去的经验。在阅读中,人们会利用头脑中的图式去同化阅读的信息,在回忆的时候,是对储存的结构化图式的回忆,如果人们遇到的故事与通常的理解有矛盾,人们把它放到现存的图式中就有困难,倾向于不对它加以记忆或者对它进行“规范化”,修改它的细节直到与现存图式一致。

总体上看,Bartlett对文本阅读的研究还显得有些粗糙,其研究范式仍缺乏严谨,图式理论的解释也不够完善,但是,作为严格文本阅读认知研究的第一人,其研究在文本阅读研究领域起了先导作用,继其之后近30年的研究中,图式理论一直占据主导地位。正是由于Bartlett的研究,才引发了更多研究者加入到文本阅读研究领域中来,促进了文本阅读研究的不断进步和发展。

二、文本阅读研究的理论概观

尽管西方文本阅读研究最早始于19世纪末期,严格的文本阅读研究也于20世纪30年代就已出现,但其后的三四十年中,文本阅读却一直没有真正成为实验心理学的主要研究领域。直到20世纪70年代,在信息加工主流思想的引导下,现代认知心理学迅速发展,激发了越来越多的研究者对文本阅读产生浓厚兴趣,这一方面的研究才得以真正发展。随着新研究方法和技术的不断发展、使用,以及文本阅读关注的研究内容日益精细化,研究者对人们的阅读过程提出了越来越多的理论模型和解释。这些理论模型从本质上来看,可以归为3 大类:一类理论模型关注于文本阅读表征方式的探索,而另一类模型则注重于分析和揭示文本阅读动态的加工过程,还有一类理论模型从实际应用出发,希望应用计算理论构建一种复杂、量化和可计算机模拟的模型,下面对这三类理论模型作些简要的概括。

(一)文本阅读的表征模型

关于阅读表征的讨论,从上个世纪70年代开始尤其热烈,当时许多认知科学家在涉及编码、表征、提取以及言语运用等许多方面提出了一些重要的理论,而这些理论或多或少地被文本阅读的研究者加以借用,试图更好地理解文本阅读过程中读者所构建的心理表征,以及这些表征又如何指导后继的阅读等问题。

研究者普遍同意,在人类的思维活动中,当人们分析和解释新情况时,要使用过去经验中积累的知识,这些知识规模巨大,并以特定的结构形式保存在人的记忆中。因此,文本阅读理解中一定涉及到比单个命题更大的知识结构。Minsky认为这个知识结构可以用框架(frame)来表示,并由此形成了他的框架理论。Minsky认为,框架作为一种知识结构,用来表示某种固定的情境;当一个人碰到某种情境时,就从记忆中选取相应的框架,并依据框架所提供的知识来理解情境,做出某种预期或反应。其框架理论中所关心的主要问题是:一个智能系统需要什么样的知识,有关的知识应该怎样相互联系并组织在一起,一个计算系统怎样才能有效地利用这些知识。

Schank和Abelson领导的耶鲁认知科学课题组则用脚本(script)这一概念来表达文本阅读理解的知识表征结构。脚本是比概念表达式更大的知识单元, 人们在日常生活中经常遇到的一些事件,如娱乐、就餐、旅行等等,都是由一系列相对固定的行为序列和特定的环境条件所组成的。脚本将这些行为序列和环境条件组织在一起,形成关于这些事件的知识单元。由于脚本提供了事件发生的背景以及事件中应该出现的行为序列,所以脚本不仅是一个知识存储结构,而且也是在自上而下的加工过程中提供加工依据的预期源。Schank后来又对脚本概念进行了较大的修改和发展。

另一些研究者则认为要研究文本阅读所形成的表征,一定要先了解一个文本可能的结构,这就需要对文章的结构进行分析。受Chomsky理论的启发, 一些研究者希望使用一些与Chomsky在进行句法分析时所使用的转换规则类似的重写规则, 来生成文章所具有的结构。其中最具代表性的工作是Rumelhart 在对寓言故事进行研究的基础上于1975年提出了故事语法(story grammar)。 故事语法是对句子语法的一种比拟,它包含了一系列用来分析和构造故事结构的句法规则和语义规则。根据这些规则,可以描述出一个故事可能的结构。从理论上说,故事语法可以描述任何故事的结构;不过从实践上看,故事语法更经常地被用于描述在一定条件下、一个特定故事的组织结构。故事语法提出了故事结构在人们头脑中的一种可能的表征形式。通过这样的表征和相应的加工过程,读者能够理解故事,并且形成在阅读过程中必备的、有关故事的一般性结构。继Rumelhart之后,Mandler 和Johnson 、Thorndyke和Mandler都发展了故事语法的概念,并通过一系列实验证明了故事语法具有一定的心理真实性。

在对先期阅读研究批评和借鉴的基础上,Kintsch和van Dijk在1978年区分了文本阅读的两种结构。他们认为,当读者阅读一篇文章时,首先是对文章中的文字进行表层解码,获得表层结构(surface structure),然后将这些表层结构解释为一连串基本命题(proposition),这些命题按照语义关系被组织起来, 形成两种水平:一是微观结构水平(microstructure ), 一是宏观结构水平(macrostructure)。微观结构又称文章基面(textbase),是文章的局部水平, 即一个个命题以及它们间关系的结构;宏观结构是一个更为全局、整体性的结构。到了1988年,Kintsch和van Dijk进一步将读者阅读时的表征分为3种水平:文章字词本身的水平(surface),即表层表征或字词表征; 由命题及其关系构成的文章的语义结构水平,即文章基面(textbase),又称文本基础表征或命题表征;以及与其他先前知识整合而成的、更深层理解的文本表征——情境模型(situational model)。Kintsch等人提出,成功的阅读理解,关键是要形成一个完善的深层表征,即情境模型。对阅读过程中不同水平表征进行区分, 这一思想极大地启发了后来研究者对文本阅读的研究,成为联系文本阅读理解先期研究与后期研究的一座桥梁。

20世纪90年代以来,最有特色的文本阅读表征理论当推Zwaan等人于1995 年提出的事件标记模型(Event-indexing model), 该理论从细节上对心理或情境模型的加工进行了说明。他们认为,事件是情境模型的焦点, 事件一般包含多个维度,如空间(spatial relation )、 时间(temporal relation )、 因果(causal relation)、主体(protagonists)和目标(goal)等,读者可以根据任何一个维度形成关于故事事件或行为的情境模型。为了进一步分析情境模型, Zwaan等人又区分了3种类型的情境模型:当前模型(current model)、整合模型(integrated model)和完全模型(complete model)。同时他们还区分了情境模型加工的4 个典型过程:建构(constructing)、 更新(updating )、 激活(retrieving)和聚焦(foregrounding)。根据他们的理论框架, 读者在阅读开始时首先建构一个由单个句子或短语描述的情境形成的当前模型;当他们继续读下去的时候,每个句子产生一个新的当前模型;来自所有句子的信息进而整合成一个模型,称之为整合模型。把新句子融入整合模型的过程称之为模型的更新。在阅读过程中,读者可能更关注于某一些类型的信息,而非其他信息,这个过程称之为聚焦。当读完所有句子以后,整合模型就作为完全模型存储在长时记忆中。后来,当读者试图回忆读过的信息时,完全模型或者它的成分就从长时记忆中激活。

(二)文本表征的加工过程

认知心理学不但关注静态的表征,同时还关心形成这一表征的动态加工过程,文本阅读的研究领域也表现出这一特点,研究者除了讨论阅读过程的产品,即文本表征的特点之外,对表征的构建、更新和变化等动态的加工过程也十分关注。

对过程的讨论最早主要受到表征概念变化的影响,20世纪70年代末期,计算机、控制论和信息论的理论深入到心理学之中,心理学界关于人类知识表征的概念发生了巨大变化,图式的概念被再一次提起并且迅速成为人工智能领域和心理学领域最为流行和常用的概念之一。 其中对图式作了大量研究的最主要的一个代表人物是Rumelhart,他在自己故事语法思想的基础上于1980年明确提出了知识表征和阅读理解的图式理论。Rumelhart认为,文本阅读理解就是选择和激发能够说明输入信息的图式与变量约束的过程,即是说,阅读理解首先是输入一定的信息,然后在记忆中寻找能够说明这些信息的图式,当足以说明这些信息的图式被找到或者是某些图式被具体化以后,我们就说产生了理解。在理解过程中加工的层次是循环递进的,随着阅读行为的不断进行,更高层次的图式被激活,理解的循环就走向更高的水平,产生对句子的理解以及对语段和文本的理解。

到80年代之后,对文本阅读加工过程的探讨,本质上仍与认知心理学的另一基本问题——自上而下与自下而上加工的争论——有关,就文本阅读领域来说,自上而下加工观主要强调理解表征构建过程中读者的主动性,这类理论以建构主义理论(Constructionist theory)为代表。而自下而上加工观主要强调理解过程的自动加工过程,这类理论以记忆基础文本加工理论(Memorybased text processing view)为代表。也有一些综合性的理论,如Kintsch等人的建构整合模型等,力图较为细致地刻画文本阅读过程中自上而下与自下而上两类过程,建立一个全面的文本理解模型。

1.自上而下的文本加工观。主张自上而下加工观的文本阅读理论首推建构主义理论,建构主义理论的集大成者是Graesser、Singer等人,他们提出了意义搜寻(search after meaning)原则,强调意义的主动搜索,认为读者在阅读过程中总是努力地去寻找能解释文章中某一事件、行为、目标的一般及特定的信息源,这种搜索寻找的状态不管文章在局部上是否保持连贯都会发生。早期持建构主义思想的研究者主要集中在探讨阅读过程中的推理,如因果推理的加工过程。对这一问题,到了20世纪80年代后期,同时并存两种有影响力的观点:其一认为阅读理解是一个问题解决过程,在阅读过程中,读者必须发现联系文章开始部分和结尾部分的一系列因果关系。其二认为读者阅读完每一个句子之后,策略加工把读者的注意集中在处于短时记忆中的一组信息上,如果这些信息与接下来的句子之间存在恰当的联系,理解就会被促进。Fletcher等人将这两种观点结合起来,提出了当前状态选择模型,试图详细说明文本理解过程中,明确陈述的事件、行为和工作记忆里的信息之间建立因果关系的各种规则。该模型详细说明了当因果先行词处于短时记忆时,当前句子和因果先行词(即一个先行的事件、状态和高级目标)之间如何建立因果关系。如果因果先行词处于短时记忆,只要因果先行词没有出现结果,它就仍然处于短时记忆。一旦关系被建立,因果关系就从短时记忆转入长时记忆。如果对正在阅读的句子没有发现因果先行词,就会发生局部连贯中断,读者就会到长时记忆中寻找原因。这一模型仍然比较强调阅读加工过程的主动性和策略性。

建构主义的思想发展到20世纪90年代后期,该理论讨论的范围已超越了推理加工,转向更一般的信息激活与整合问题。它认为阅读是一个积极的、策略加工过程,读者会对文本的事件、主人公的行为和状态进行解释,根据当前阅读的内容主动地激活背景知识,将当前的信息与先前的信息进行整合形成文章的情境模型,以获得连贯的心理表征。 建构主义理论的典型代表是更新追随假设(Here- and-nowview)。更新追随假设认为读者在阅读过程中总是不停地对当前阅读信息的意义寻求解释,把当前阅读的句子与先前的句子进行整合,不断追随新阅读的信息对已建立的文本表征进行更新,并将更新后的模型带到下一步的阅读中去。

2.自下而上的文本加工观。相比之下,另一些研究者更强调阅读理解的自动性与非策略性。如McKoon等人提出的最低限度假设(Minimalist Hypothesis)。认为读者的阅读存在着两种情况,有明确阅读目的的阅读与没有明确阅读目的的阅读(即自然阅读)。 在前一种阅读中, 读者所产生的推理称之为策略性推理(strategic inference); 后一种阅读中读者所产生的推理称之为自动化推理(automatic inference)。他们认为,要研究推理的产生,必须从最简单的自动化推理入手,只有清楚地了解读者的自动化推理,才有可能为以后全面的推理研究打下基础。McKoon等人认为,在无明确阅读目的的情境下,读者自动产生的推理只是为了达到保持局部联贯性的最低需要,只有在局部信息缺乏一致性,无法形成命题时,才需要提取文章的整体目标信息以形成完整的表征。最低限度假设后来推演到一般的信息加工过程而不仅仅是推理过程,认为在自然阅读情况下,读者不会随着阅读过程即时地进行整合、推理以形成文章的整体表征,阅读的信息加工主要属自动化加工,在这种阅读理解过程中,读者的角色是相当消极的,他们只对那些易于获得的信息进行整合,只要当前阅读的信息能与读者工作记忆中保持的刚阅读过的若干命题进行整合保持局部连贯,则不需要再通达长时记忆中文章先前的相关信息或读者的背景知识,只有在当前加工的信息出现了局部连贯性中断的情况下,读者才会激活长时记忆的信息去进行整合与推理。

到底自动化的加工过程如何实现呢?McKoon和Ratcliff等人认为,对文章中字词、概念、命题以及整体的理解必须以激活记忆中相关的信息为基础。这种思想后来发展成为一种新的理论框架,即记忆基础文本加工理论,该框架下包含了相当多的理论,这些理论有个共同点,都强调在阅读过程中,长时记忆中的背景信息通过消极激活而得以恢复。事实上,这一理论借鉴了当代记忆理论的两个概念:一是Tulving依赖线索回忆的观点,即线索直接地和有选择地从记忆中唤起相关信息;二是Posner把快速的认知加工和慢速的策略加工区分出来的观点。记忆基础文本加工理论认为文本加工的所有认知研究基本上都是以记忆为基础的,它的中心原则是对每一个新的语言信息的理解都会唤起记忆中的有关信息。认为文本阅读过程中,即使在局部连贯性不中断的情况下,读者也会通达背景信息,新阅读的句子进入工作记忆后,该句子所蕴含的概念和命题以及存在于工作记忆中的信息都自动向长时记忆发送信号,非策略地、被动地、快速地激活长时记忆中的与这些信号匹配的文本信息,读者不仅要将当前进入的文本信息与工作记忆中保持的文本信息进行整合维持局部连贯性,而且要与通过“共振”的方式激活的长时记忆文本信息进行整合,维持整体连贯性。记忆基础文本加工理论比较注重对阅读过程的实时研究,其研究数据比以往的理论能更真切地反映阅读的实际过程。在我国,王穗苹和莫雷、莫雷和赵冬梅等人在中文条件下的研究也都进一步支持和发展了记忆基础文本加工理论。

3.建构整合模型。 如前所述, 另一些文本加工理论显得更为综合, 其中Kintsch 和van Dijk1988 年提出的文本阅读的建构整合模型(Construction-Integration model,简称CI模型)最具代表性。在区分不同层次阅读表征,即表层表征、文章基面以及情境模型3个层次表征的基础上,Kintsch等人认为,文本阅读理解的加工过程可以分为建构和整合两个阶段。建构阶段的任务是形成文章基面,在这一过程中,自下而上的加工起着较大的作用,而整合阶段的主要任务是形成情境模型,这个过程相对来说更多地需要自上而下加工的参与。Kintsch 认为,文章理解是以循环为单位进行的,循环大致相应于短句、短语或任何一个文章单元。在每一个循环里都会建构一个新的网络,包括来自先前循环的短时记忆留下的内容。一旦这个网络被建构,整合加工就开始作用。建构整合模型可以解释许多实验结果,如段落中的命题越多,读每个字所用的时间就越长;高水平的命题在工作记忆中储存的时间长,被精加工的程度也高;命题的层级越高,在自由回忆任务中越容易被回忆等。建构整合模型综合了记忆领域关于知识表征的计算机模型和关于实时理解、并行加工的一些观点,以及影响这些加工的基本认知因素(如工作记忆),并力图提出关于阅读内部加工及其关键机制的一些具体和可验证的假设,因而成为文本加工理论的一个经典模型。

(三)文本阅读理解的计算机模型

随着文本阅读研究的发展及其实验数据的积累,一些文本阅读心理学家尝试着从宏观方面应用计算理论构建一种复杂的、量化的和计算机模拟的文本阅读加工模型来阐述阅读理解过程的心理机制。这些文本阅读加工模型试图详细地阐明文本阅读中的表征、加工过程以及它们之间相互作用的机制。最成功的模型可以模拟读者动态地逐词或逐句理解文本时,表征中每个结点的生成、激活、限制和抑制。例如,以文本中某一个结点的激活强度来说,该强度值应能预测读者在单词命名、单词再认和语义判断这样的任务中的表现;单词的阅读时间和对单词的注视持续时间应与模型用以解释单词的加工周期有交互作用;对文本命题的记忆应与该命题在整篇文章中累积的激活强度有交互作用。事实上,在模拟这些数据模式方面,有些复杂的模型已取得了一些成功。其中Just和Carpenter在1992年提出的CAPS/READER模型可以说是这类模型中最具代表性的一个。

CAPS/READER模型采用产生式系统的等级结构来说明工作记忆和长时记忆中结点的生成、更新和替换。产生式系统包括一系列“IF<条件C>,THEN<行动A>”形式的产生式规则:如果工作记忆中的内容与条件C匹配,则执行认知的或物理的行为A。条件C也许由一系列任意复杂的子规则组成,对于每种条件还有一种阈限标准,即如果所有的子规则的总激活值满足这一阈限,则条件被满足。这一系列的产生式规则在每个加工循环中被平行地评价。满足激活阈限的那些规则最终执行各种行为,如扫描外显的输入信息,调整工作记忆中结点的激活值,改变工作记忆的负荷,强化长时记忆中的结点,并产生输出的信息等。

三、文本阅读的两种新观点

最近十几年来文本阅读研究者特别关注阅读中的信息加工过程,即读者是否会即时地激活已进入长时记忆的文本信息并与当前阅读的信息进行整合,关于这一热点问题,一直存在着建构主义理论、最低限度假设和记忆基础文本加工理论3 种理论争议。如何解决这一争议成为当前研究者越来越关注的话题,并由此形成了文本阅读研究的两种最新观点。

(一)文本阅读的双加工理论

莫雷等人对前人有关文本阅读的研究成果,特别是关于建构主义理论和记忆基础文本加工理论的相关研究成果进行了全面的总结和分析,在此基础上提出了文本阅读的双加工理论,对文本阅读研究中的主要争议进行了初步整合。该理论的基本观点是,文本阅读过程是连贯性阅读与焦点阅读的双加工过程,在文本阅读过程中,读者所阅读的信息不同,产生的信息加工活动也不同,读者会根据阅读的文本信息的性质交替发生不同的加工活动。第一种是连贯阅读加工。如果进入的文本信息是没有引发焦点的信息,或者是与焦点无关的信息,读者进行的就是连贯阅读加工活动,其主要任务是维持文本语义的局部连贯或整体连贯。最低限度假设与记忆基础文本加工理论主要揭示的是连贯阅读加工的性质与特点。第二种是焦点阅读加工。为了理解文本,读者会对文本中的目标系列的信息、因果系列的信息形成焦点,当所进入的文本信息是属于有明确的因果关系的信息,如目标信息等,就可能会自动引发阅读焦点(目标焦点),焦点一旦形成,就会使随后的阅读过程成为焦点加工的过程。焦点阅读主要使读者把握阅读文本的基本要旨,形成文本的局部或整体的逻辑连贯。建构主义理论揭示的便主要是焦点阅读加工的性质与特点。

莫雷和王瑞明等人首先通过实验对连贯阅读加工活动的特点进行了探讨。他们的实验结果表明,当前信息通过记忆基础文本加工理论所提出的共振方式非策略地、自动地、快速地激活先前的有关信息后,如果当前信息跟先前信息存在局部不一致或不协调,就会进一步地对前后信息全面的连贯关系进行整合,这一信息整合过程可以称之为协调性整合;协调性整合是连贯阅读中一种重要的信息加工方式,其目的就是要维持新信息与先前信息的连贯性,更重要的,协调性整合是一种建构性的整合,其结果是将相关的信息建构成整体的信息块,当它们被再次激活时,就会以信息块的形式出现。莫雷和冷英则探讨了焦点阅读加工活动的特点。 他们通过实验对目标焦点监控下目标信息的建构与整合进行了初步探讨,实验结果表明,在没有共振的情况下,目标启动句也可以激活先前的目标信息引发焦点整合;另外,在目标焦点监控下可以发生阅读信息的追随性建构。

在这些研究的基础上,王瑞明设计系列实验对连贯阅读加工中的协调性整合进行了系统探讨,冷英设计系列实验对焦点阅读加工中的焦点整合进行了系统探讨,这些都为文本阅读双加工理论提供了大量的实验证据。

(二)风景模型

20世纪90年代中期,研究者越来越关注文本阅读中理解加工和记忆表征之间的关系。读者在阅读文章时表征会不断地改变,并且不断发展变化的表征其自身又为读者理解接下来的文章提供了重要的资源,因此这一关系是复杂的、双向的。为了更好的理解文本阅读中读者头脑中的整个加工过程和记忆表征的形成过程,vanden Broek等人于1996年提出了风景模型(Land scape model)。

信息激活是文本阅读中最基本、最核心的问题,读者在加工文章时会激活文章中提及的概念以及这些概念间的关系。风景模型认为,信息激活有两种机制。第一种机制是群体激活(cohort activation),即从当前被激活的信息向相关信息传播激活的过程,群体激活是基于记忆的、迅速的并且被动的。第二种机制是基于连贯的提取(coherence-based retrieval),它是策略性的,经过准备的信息提取是为了理解当前文本的需要,并进而形成连贯性。而决定文本阅读中进行何种激活的主要因素是阅读中读者要保持的连贯标准(standards of coherence),这一标准反映了读者在阅读时试图获得的理解程度。连贯标准受读者自身因素的影响,如阅读目标、期望(expectations)、工作记忆容量、观点(perspective)等;也受文章因素的影响,如文章体裁、呈现速度、任务变量等。风景模型认为读者阅读中会建立起各种不同类型的连贯,如相关的、因果的、时间的、空间的,等等。阅读过程中可以通过群体激活相关信息一次就满足读者标准,但在另一种情况下,读者也需要通过基于连贯的提取来主动搜索事件文本表征、背景知识来实现这些标准。

风景模型认为文本阅读过程就是一个不断波动的激活过程,概念激活因为各种因素影响上下波动就像形成了一道美丽的风景。成功的阅读加工结果是建构起一个连贯性的心理表征。跟其他的文本阅读理论模型比较,风景模型提供了一个整合许多因素的理论框架(如不同的关系类型、连贯性标准、学习曲线等)。在先前的一些研究中,风景模型的概念框架通过比较记叙文阅读中计算机模拟和被试实际阅读数据得以证实。总体上看,风景模型是动力上相互作用系统(a dynamically interacting system)的一部分,它不仅有来自行为实验和计算机模型研究的证据,还有来自神经心理学研究的证据,可以说,风景模型是当前对阅读理解的过程和产物的一个相对比较完整的理论描述。

四、文本阅读研究的发展特点

文本阅读研究经过一百多年的发展,时至今日,已经取得了大量的研究成果和结论,对这些成果进行梳理,可以从整体上把握文本阅读研究发展与演变的特点,下面从文本阅读研究的理论基础、研究方法、研究内容和研究结论4个方面对其发展特点作些分析。

(一)理论基础:从认知主义到联结主义

文本阅读也是认知心理学领域的重要课题,其研究必然受到认知心理学研究中各种思潮的影响。现代认知心理学中存在着两种不同的研究取向:其一是符号的取向,即认知主义取向;其二是网络的取向,即联结主义取向。在20世纪六七十年代的文本阅读研究中,认知主义取向占据着主导地位,并且直到今天仍具有强大的影响。自20世纪80年代开始,有一些研究者开始对认知的研究取向进行了新的探索和改进,他们所建立的框架被称为联结主义(有时也被称为平行分布加工,或PDP)。认知主义与联结主义取向的主要区别在于其所认为的认知加工发生的方式不同。根据认知主义的观点,认知加工是一种系列的加工,首先是加工的发生,然后信息进入下一阶段,之后又进入下一阶段,等等。相反,大多数(虽并非全部)联结主义模型认为认知加工发生是平行的,并且许多加工发生在同一时刻。认知主义认为,需要有一个中央处理器来指导信息从一个加工阶段到另一个加工阶段。而联结主义赋予网络以核心性的地位,采纳分布表征和并行加工的理论,强调的是网络的并行分布加工,注重的是网络加工的数学基础。根据联结主义的观点,不同的激活类型已经考虑到了各种认知过程,知识不是储存在各种储藏室里而是在联结的单元之内。当改变单元之间联结的权重,导致新的联结类型的建立,那么学习便发生了。大多数的联结主义工作者基于神经网络模型来开展研究,他们运用计算机程序,作一些可重复性的实验和准实验。在当前的文本阅读研究中,联结主义正逐步取代认知主义,成为当前大多数实验的指导思想。

(二)研究方法:从延时考察到实时探测

文本阅读研究之初,研究者更多采用的是一种延时(off-line)的办法来对文本阅读理解进行考察。其所采用的程序一般经过实验指导、阅读材料、进行探测几个相互连续的过程。各种延时方法的共同点是所有对文本阅读中心理加工的考察都不是实时进行的,而是在阅读发生之后,对阅读结果进行探测,从而对阅读加工的历程进行推论而得出结论。这些方法中的不同点主要在于在阅读之后所采取的探测方式的差异。一般而言,对文本阅读的延时考察主要采用回忆法和再认法两种手段。例如,Bartlett的研究中所采用的就是一种典型的阅读回忆法。从20世纪六七十年代开始,随着认知科学的兴起,尤其是计算机等科学技术的发展,使得文本阅读研究的方法取得了重大的发展。文本阅读认知研究中逐步出现了用实时(on-line)的技术来对文本阅读的认知历程进行考察,而先前的延时方法也因新技术的运用而得以更进一步的发展。在当前的文本阅读研究中,实时研究占据着主导地位。这其中,阅读时间法和探测法是最流行的实验手段。阅读时间法是将阅读时间作为一个指标,通过分析被试的阅读时间来揭示其理解加工的心理历程。探测法在运用过程中要求被试对某一个问题迅速作出判断,通过考察问题呈现与判断作出的时间间隔来分析被试阅读过程中的心理加工情况。另外,一直有一些研究者利用眼动仪等设备开展文本阅读的认知研究,它是一种更为精确而又相对自然的实时测量手段,从而可以更为深入地探讨文本阅读过程中的心理现象及其规律。

(三)研究内容:从图式表征到情境模型

1932年,Bartlett首次将图式这一概念引入文本阅读研究领域,阅读心理学家从此开始了广泛的以图式为主要内容的文本阅读研究,直到20世纪80年代,对文本阅读中图式表征的研究一直占据着该领域研究的主导地位。在几十年的发展历程中,图式自身的内涵与外延也在发生着变化。现代图式理论认为,经验本身并不储存在记忆之中,它们是用表象、命题或其他形式表现出来,它们按照一定的位置、时间分层次地组织排列,这就构成了图式。Rumelhart则把图式称之为认知建筑的组块,是所有信息加工所依靠的基本要素,并在此基础上详细阐述了图式的主要特点。研究者认为,头脑中已有的图式对于阅读新文本和学习新知识,都有着举足轻重的作用。相对于图式而言,情境模型研究的历史并不长,直到80年代Kintsch 等人才在文本阅读理解的研究中首次提出这一概念。但近年来的有关研究却发展迅速,进入90年代,情境模型在文本阅读表征的研究中已经逐步取代了图式研究,成为文本阅读研究的热点内容,并构成了认知心理学的重要领域,有关情境模型的理论也已应用于多个领域,如语言理解、记忆提取、逻辑推理,等等。情境模型也称心理模型(mental model),它表述的是一个人对真实或想象世界中所描述或经历过的特定事件或状态的理解。在阅读研究中,它指的是读者对文本所描述的情境的心理表征。当前大多数认知心理学家认为,文本理解的过程就是读者建构一系列多层次的心理表征的过程,而一个连贯的情境模型的建构就可以认为是达到了一篇文本的成功理解。

(四)研究结论:从理论纷争到逐渐融合

在文本阅读研究的历史上,涌现出了很多的理论和观点,这些理论都有各自的基本观点和实验支持,不断的引发了文本阅读研究的理论纷争,随着文本阅读研究的不断深入,有些理论由于其局限性逐渐被研究者所淡忘,或者融合到其他理论当中;但有些理论彼此之间互不相让,争议一直存在。根据它们对文本阅读过程的看法,总体上可以归为3类:一类理论强调的是自上而下的加工过程, 这类理论以建构主义理论为典型代表;另一类强调的是自下而上的加工过程,这类理论以最低限度假设为典型代表;还有一类理论虽然也强调文本阅读中的自下而上过程,但却并不像最低限度假设那么极端,这类理论以记忆基础文本加工理论为代表。实际上,文本阅读过程是非常复杂的,任何一种理论都不能覆盖所有过程,每一种理论从不同的角度提出了各自对文本阅读过程的看法,有分歧必然就有整合。近年来,随着研究的不断深入,人们在文本阅读研究的理论和经验上产生新的认识,形成了几种新的解释力和预测力更强的整合性理论,如文本阅读双加工理论和风景模型就是其典型代表。这些理论是吸收各种理论的精华而获得的更完善的理论。

五、文本阅读研究的未来展望

通过文本阅读研究百年历史的回顾,在综合分析文本阅读研究发展演变特点的基础上,可以看到,当前文本阅读研究虽然已经取得了大量的研究成果,但在未来的文本阅读研究中,以下几个方面仍需研究者的进一步关注。

(一)文本阅读的各级水平研究还须深入

读者在文本阅读过程中不仅要建构起文本基础表征,还要形成情境模型。在理论上,文本基础表征主要是文本自身命题网络在头脑中的表征,而情境模型则是文本自身表征与读者背景知识相互作用的结果。但两种表征在建构过程中并不是相互孤立的,而是彼此联系并相互影响的。因而,在实验中如何对这两种表征进行区分就成了研究者们所面临的首要问题。但是,由于文本表征本身的复杂性,在区分情境模型与文本基础表征上至今未能取得一致的意见。另外,文本阅读过程中通常包括读者背景信息的重新激活,这些背景信息既有来自文章先前阅读过的已经进入长时记忆的信息,也有读者的一般世界知识。一般世界知识在读者阅读文本中起着重要作用,它们可以使读者在阅读过程中去填补没有在文中详细表述的细节,从而建构起情境模型。当前文本阅读研究中研究者往往只是变化文本本身一些特征来考察文本阅读过程,对读者一般世界知识的考察明显不足。关于读者的一般世界知识是如何表征的、它在建构情境模型中的作用以及发生作用的具体过程都有待在以后的文本阅读研究中进一步探讨。

(二)情境模型的维度整合研究需要加强

文本阅读中情境模型的建构是当今阅读研究的热点,自Zwaan 等人提出事件标记模型理论以来,很多研究者对影响情境模型建构的空间、时间、因果、主体和目标等维度进行了大量的研究,取得了一定的研究成果。但是,在实际的研究中,研究者们往往用情境模型单维的研究结果推论整个情境模型的加工,即存在“单维研究多维解释”的特点。如de Vega以情境模型空间关系的更新为研究对象,而结论中却是对整个情境模型加工的解释;McKoon等也是采用了这种研究范式,用以因果维度加工为主的考察,从而作为其记忆基础文本加工理论的实验基础。实质上,这样的研究及其理论解释存在一个前提假设,即在文本情境模型的加工过程中,所有维度的加工都表现出相同的规律。如果这个假设不成立的话,那么许多单维研究多维解释的结论就应该做出必要的修正。近年来的一些研究者已经注意到了这一点,研究者也试图通过把情境模型的几个维度结合起来,对情境模型的多维度的加工做出考察,结果发现,情境模型不同维度的加工具有不同的特点,体现了不同的规律。因此,在文本阅读的未来研究中,情境模型的维度整合研究需要加强。

(三)文本阅读的大脑机制研究备受关注

20世纪末期,认知神经科学产生并迅速发展,随着该领域研究问题的深化,特别是研究技术的发展,文本阅读心理学家在先前采用的认知实验心理学行为研究范式的基础上,进一步采用认知神经科学的研究方法和技术对文本阅读过程中的大脑机制进行探讨。近10年来国外已有研究者利用事件相关脑电位技术(ERP )和功能性磁共振技术(fMRI)进行了文本阅读脑机制的初步研究,并取得了一定的成果。比如,有研究者发现词汇的语义知识和一般世界知识在句子理解时是同时整合的,大约出现在关键词呈现后300毫秒。另外,还有研究者对右半球是否参与文本加工进行了初步探讨,但这方面的结果争议很大。总的来看,当前认知神经科学领域对字词句加工的脑机制探讨的相对多一些,而对文本阅读的脑机制的探讨相对少的多。随着研究技术的不断进步,从语篇水平探讨文本阅读过程中信息加工不同活动和不同阶段的脑区定位,以及脑电活动的区域和强度变化必将受到人们更多的关注。

(四)汉语文本信息处理技术亟待开发

传统的语言研究通常是为语言教学、文献整理、社会历史研究服务的。这样的研究完全是面向人的,这样的研究搞了近两千年,取得了不少可观的成绩。电子计算机出现以来,人与计算机之间要进行信息的传输和交流,因此,除了继续进行面向人的语言研究之外,还要开展面向计算机的语言研究。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。在这方面,西方国家早在上个世纪中期就开始投入了相当多的资金和人力,在进行文本理解研究的同时同步开发和研制各式基于文本的机器理解系统,例如70年代中期研制的MARGIE系统、SAM系统、PAM系统等,都能概括各种具体知识结构和一般经验,综合句法、语义、知识、推理为一体,在某些特定的文本处理上较为成功。相比之下,我国在这方面的研究仍处于较为落后的地位。到目前为止,中文信息处理基本上还停留在“字处理”阶段,也就是说计算机对汉语的“认知”至多是在一个字一个字地进行。现在市面上有些信息产品似乎越过了“字词处理”阶段,给人以假象,使人误认为计算机对中文信息的处理已经“自动化”了。然而事实上,这些产品多是基于在一定量的语料中对词汇进行统计,依据词出现的概率而研制的。其处理的基本单位也是“字词”。中文信息处理,只有进入到语言处理阶段,至少要使计算机理解高于字词的自然语言文本所表达的意图、思想等,才能真正实现自动化。

造成这种局面最突出的问题在于中文认知及脑机制研究与计算机中文信息处理技术研发的脱节。事实上心理语言学家很少考虑中文信息处理技术发展的需要,只顾进行学院式的实验研究,一些成果显得琐碎而无意义。而中文信息处理的专家也很少与心理语言学家合作,单纯进行人工智能研究,只要机器能代替人类做到的,不论是否以人的方式进行都可以接受。应该说这种初级研发状态在生命科学时代已经越来越不适应。人脑是比计算机复杂得多的系统,人脑既能完成比计算机更复杂的信息加工,又有计算机不具备的人类灵活的协调性。要获得更接近人类语言信息加工的模型,首先必须对人进行研究。目前,许多学者已经意识到这一问题,如全国人大副委员长、著名学者许嘉璐指出,目前我国计算机中文信息技术研发正面临着很大的困难,甚至可以说正处于“瓶颈”时期。而出现这种瓶颈的关键原因,是计算机领域与现代汉语、心理学、逻辑学和脑科学等研究领域的隔绝状态没有出现根本性的改变。这可以说是个致命的弱点。因而,未来,计算机学界和汉语言学界、心理学界及脑科学研究队伍相结合,开展面向中文信息处理的基础和应用研究将是文本研究领域的重要发展趋势。

收稿日期:2006—08—30

基金项目:教育部哲学社会科学研究重大课题攻关项目(批准号:05JZD00034)、国家自然科学基金项目(批准号:30570616)和全国优秀博士学位论文作者专项基金项目(批准号:200208)资助。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

近百年来文本阅读研究述评_信息加工理论论文
下载Doc文档

猜你喜欢