外语听力元理解监控准确性的研究_元认知论文

外语听力的元理解监测精确性研究，本文主要内容关键词为：精确性论文,听力论文,外语论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

1.研究背景

听力理解既是认知过程，也是复杂的元认知过程。在这一过程中，熟练的听者往往能够根据语篇信息主动建立、检验和修正假设，运用已有知识来构建文本意义，同时这一过程需要听者的监控、调节、评价等各种元认知活动的参与。对听力理解过程与结果的准确监测不仅能够帮助听者即时察觉理解中存在的问题，而且能够促使其采取措施弥补理解失误，提高听力水平和效率，因此元认知对外语和二语听力教学具有特殊意义。

1.1 外语听力的静态元认知研究

根据Flavell（1976）对“元认知”概念的界定，元认知作为认知主体对自身认知活动的认识，一般包含两方面内容：一是元认知知识，二是元认知监控。前者是指认知主体已经获得的有关认知过程的知识以及可用来调控认知过程的策略性知识，后者则是指认知主体以当前认知活动为对象进行的一系列积极、自觉的监测、控制和调节活动。由此，元认知既可以被看作是一个静态的知识实体，也可以被视为一种对当前认知活动的动态管理过程。20世纪80年代以来，国内外有关外语和二语听力的元认知研究屡见不鲜。大量实验证据表明，在英语、法语、俄语等不同母语和目的语背景条件下，元认知意识（Goh 2002；Vandergrift 2003，2005；Vandergrift & Goh 2006；石洛祥2005）、元认知知识和策略水平（O'Malley & Chamot 1990；Thompson & Rubin 1996；林琼2002；吕明才2007）在外语听力理解中具有重要作用。然而，这些研究基本上是从静态元认知知识的角度，采用问卷、量表及日记等工具对元认知与听力理解的关系进行考察，尽管在某种程度上也能够揭示元认知在听力理解中的作用，但未从动态元认知体验角度对元认知能力进行在线测评。

1.2 听力理解的元认知监控研究

在听力元认知研究领域，针对听力过程的元认知监控研究相对薄弱。现有研究主要采用“冲突察觉法”（Expectancy Violation Detection Task）或“错误识别法”（Error Detection Task）对听力理解的监控能力进行测量。在这类研究的实验中，研究者首先向被试呈现正确的听力文本，然后再呈现部分内容已修改的听力文本，目的在于诱发听者产生理解上的冲突。研究者即时记录下被试对这些冲突或逻辑错误的察觉，以此作为元理解监控的指标。Skarakis-Doyle（2002）、Skarakis-Doyle和Dempsey（2008）采用这种方法对学前儿童的研究发现，两三岁的儿童已经能够察觉故事内容前后逻辑上的不一致，但这种朴素的听力监测意识对后续评估和调控并无显著作用。此外，与一般儿童相比，语言障碍儿童的听力监测能力明显滞后。对不同年龄段儿童的发展研究（Walczyk & Hall 1991）也表明，听力的元认知监控能力随着年龄的增长逐步提高，四年级儿童正确察觉错误的比例显著高于二年级儿童。然而，采用冲突察觉法或错误识别法最大的弊端在于难以有效测量对自然文本理解的监控过程，而且该范式大多以儿童为研究对象。

1.3 阅读元理解监控研究对听力元认知研究的启示

目前，针对自然文本理解的元认知监控研究主要集中在语篇阅读领域。该领域研究不是采取问卷或量表等测量工具，而是通过比较读者的主观理解程度与客观标准测验成绩之间的一致程度（即判断值与测验成绩间的Gamma相关系数，简称G系数）来衡量元理解监测的精确水平。G系数的取值范围是[-1，1]，取值越大表明元理解监测越精确（Nelson et al.2004）。但是，近20年的调查研究结果表明，母语阅读者的元理解监测精确水平较低，G系数的平均值仅为0.27左右（Dunlosky & Lipko 2007；陈启山2011）。一般认为，读者元理解监测之所以不精确是由于他们在进行判断时使用了错误线索（Wiley et al.2005；Thiede et al 2009）。比如，读者通常会根据对文章主题的熟悉程度和感兴趣程度（Maki & Serra 1992）、记忆信息的提取流畅性（Baker & Dunlosky 2006）、文本加工容易度（Dunlosky & Rawson 2005）以及语篇长度等文本特征（Weaver & Bryant 1995）进行判断，因而影响了其监测水平提高。然而，上述结论均是基于阅读理解研究提出的。关于听力理解过程中元认知监测的精确水平如何，听者又是根据哪些线索对理解程度进行判断，几乎没有研究涉及。

近年来，以Thiede为代表的一批学者在Kintsch（1994）语篇表征理论的基础上提出了元理解的“情景模型线索假设”（Situation Model Approach to Monitoring Cues）（Wiley et al.2005；Thiede et al.2009）。根据该假设，在文本理解过程中，读者会建立起多层次的表征，具体可细分为表层表征（如词汇表征）、文本层表征（如句子表征）和情景模型层表征（在词汇和句子理解基础上，对段落或文本意义建立的有序、连贯的心理表征）。读者只有真正理解文章时，才会构建出情景模型。因此，在对理解程度进行自我判断时，读者若能利用与情景模型相关联的线索，元理解监测的精确性将会有较大提高。有研究表明，采用延迟写关键词或摘要等强化情景模型线索的策略能有效提高元理解监测的精确性（Thiede et al.2005；Anderson & Thiede 2008；Thiede et al.2010；陈启山2011）。究其原因，阅读时大量信息会在短时记忆中得到激活，其中大部分信息会随着时间的流逝而被遗忘，只有真正理解的部分才会进入长时记忆系统。读完文章后写关键词，需要对记忆系统中的线索信息进行加工。即时写关键词所加工的线索是从短时记忆中提取的，往往混杂了表层记忆线索与深层理解线索，无法帮助读者进行精确的元理解判断；延迟写关键词所需要的线索从长时记忆中提取，依据这些线索能够更好地区分哪些是真正理解的内容，哪些是尚未理解的内容，所以延迟写关键词的效果更好。但是，听力理解作为一种高度自动化的文本理解加工过程，是否存在与阅读元理解相类似的规律，或者对情景模型线索的强化是否同样能够提高听力理解的元认知监测精确水平，却鲜有学者问津。受上述有关阅读元理解研究的启发，本研究尝试从动态元认知体验角度探索听力元认知的内部机制和发生规律。

2.问题提出

当前，外语听力的元认知研究很少从动态元认知体验角度在线测量元理解监测的精确性，而且针对母语阅读的元理解监测研究所取得的成果并不一定适用于解释外语听力中的元理解现象。尽管阅读和听力同为语言输入，与阅读相比，听力在提取文本意义过程中需要将声音、词汇、句法结构以及背景知识进行更高程度的自动化整合，对外语学习者提出了更高的认知能力要求（Lund 1991）。此外，认知过程的不同，加之英、汉语言表达形式和结构的差别，势必会造成元认知体验差异。那么，外语学习者在听力理解中究竟依据什么线索对理解程度进行判断？判断精确性如何？判断又具有什么特点和差异？这些问题均需更多研究才能得到解答。

在探索元理解监测的机制方面，虽然有关延迟写关键词效应的研究证实了对情景模型线索的深度加工有助于监测水平提高，但这一结论是否适用于外语听力的元认知监控仍有待验证。再者，通过控制“关键词”变量的组间设计所获得的证据难免带有一定的间接性和推断性。Thiede等（2010）曾尝试在读者完成元理解判断后，马上令其报告判断的线索，并对线索进行分类和编码以获得更为直接的证据。然而，该研究仅限于母语阅读范畴，尚无研究对外语听力元认知监测线索的使用情况进行直接测量，考察外语学习者能否通过“延迟写关键词”这一强化情景模型线索方法提高元理解监测的精确水平。此外，以往研究在探讨“关键词效应”时都没有报告关键词产出的正确率。严格来讲，写关键词与写对关键词并不能简单对等。虽然两者都涉及对情景模型线索的再加工，但与前者相比，后者的加工程度和效果显然更为显著，而前者则有可能因为错误产出关键词而导致对监测线索的负强化。探讨关键词产出质量与元认知监测精确性之间的相关关系对于听力元认知教学和训练具有重要意义，值得听力元认知研究者深入关注。

基于上述分析，本研究旨在回答以下4方面问题：

（1）我国英语学习者听力元理解监测的精确水平如何？在对听力理解程度进行判断时，他们使用的监测线索具有哪些类型和特点？（2）不同类型监测线索的使用是否会对听力元理解监测的精确性产生不同影响？（3）不同监测线索强化任务（延迟写、即时写和不写关键词）是否会导致听力元理解监测精确水平的显著差异？（4）关键词产出质量是否会对听者元理解监测精确水平产生显著影响？

3.研究方法

3.1 被试

本研究被试是选自国内某高校英语专业本科二年级的72名学生，实验后剔除无效数据，有效被试为66名。

3.2 实验材料

实验材料为4篇听力短文，分别改编自2007年和2009年大学英语六级考试的听力试题。每篇听力短文的理解时间控制在两分钟左右。测试采用四选一单项选择题标准化测验方式，其含16题，每题1分，总分16分，其中推理题和细节题的比例为1︰3。测试题目的分半信度为0.919，与2005年托福考试听力部分的关联效度为0.862。

3.3 实验设计与程序

借鉴以往元理解研究的方法（Wiley et al.2005），实验采用“听力理解—关键词处理—理解程度判断—监测线索报告—标准化测验”的范式，其中关键词组别为被试间变量，监测线索类别、标准化测验成绩和监测精确性（G系数）为因变量。实验开始前，先按照关键词处理方式将被试分为3组：无关键词组23人，即时关键词组22人，延迟关键词组21人。实验时，无关键词组被试每听完一篇文章后立即采用七级量表对理解程度进行判断（1=完全没听懂，7=完全听懂），然后回答问题“你根据什么做出上述等级评定？”，再完成相应的标准化测验。与无关键词组有所不同，即时关键词组每听完一篇文章后，需要立即写出关于短文的3—5个关键词，随后对文章进行理解判断，完成测验。延迟关键词组在每听完一篇文章后，延迟3分钟（期间播放音乐）后写出关键词，再进行理解判断，完成测验。4篇短文测试依次进行，直至完成最后一篇测试。

3.4 编码方案

（1）监测线索类别。根据Thiede等（2010）研究中的分类标准并结合本研究被试的答案，监测线索被分为5个类别：理解类线索（对文章主旨大意的理解，即与情景模型相关联的线索）、记忆类线索（对文章内容的记忆，如“我打4分是因为我记不清短文讲的是什么”）、个人类线索（对文章的熟悉程度、感兴趣程度或者自己的听力水平，如“我打分高是因为我听力一贯好”）、表层类线索（文章的难易度、某个特定的词等文本特征）、注意类线索（听力过程中注意力的集中程度）。两名没有参与测试的教师分别记录被试不同类别线索的使用频次，每出现1次计1分，存在分歧的归类意见经协商后确定类别。评分者信度的计算方法为两名评分者一致性意见占意见总数的百分比，计算得出评分者信度为0.934。

（2）关键词。3名英语专业教师通过集体讨论的方式确定每篇听力短文的5个关键词。被试写对1个关键词计1分，写错和漏写不计分，满分20分。

4.研究结果

4.1 外语听力元认知监测的精确性及其线索使用特点

衡量听力元理解监测精确水平的指标为被试理解程度判断与标准化测验成绩间的G系数。表1列出了各组被试听力理解程度自我判断值、标准测验成绩、G系数和偏差的平均值与标准差。从表1可知，延迟、即时和无关键词组听力元理解监测精确水平（G系数）的平均值分别为0.42、0.11和0.10。这说明尽管3组被试的监测水平高于随机猜测水平，但无论线索干预是否存在，外语学习者听力元理解监测远不够精确，最高只达到0.42，表现出与阅读元理解监测类似的特点。进一步采用偏差系数考察被试的听力理解评估偏离标准测验成绩的程度，结果表明所有被试偏差总均值（M=-0.07，SD=0.73）的95%置信区间为[-0.19，0.17]，与毫无偏差的0值差异不显著（t（65）=-0.07，p=0.94）。换而言之，所有被试在评估自己的听力理解程度时，并未表现出明显的过高或过低自信。

表2列出了各组被试不同类型监测线索的使用频次（比例）。由表2可知，无关键词组被试使用频次最高的线索为表层类和理解类线索，即时关键词组使用频次最高的线索为表层类线索，延迟关键词组被试使用频次最高的线索为理解类线索。3组被试使用频次最低的线索是注意类线索，其次是记忆类和个人类线索。从中可以推断，尽管延迟写关键词能够在一定程度上增加理解类线索的使用频次，减少表层类线索的使用频次，但总体而言，外语学习者主要采用表层、记忆、个人等非理解类线索对听力理解程度进行判断，自然状态下的无关键词组和即时关键词组使用非理解类线索的比例均超过60%。

4.2 监测线索使用对外语听力元认知监测精确性的影响

为了更直接探讨监测线索类别与外语听力元理解监测之间的关系，我们以目的语（英语）听力总分为控制变量，分别对被试不同类别线索的使用频次与监测精确水平进行了偏相关分析，具体结果见下页表3。

偏相关分析结果表明，在排除听力水平因素后，只有理解类线索与监测精确水平存在显著正相关（r=0.626，p=0.000），而表层类线索（r=-0.673，p=0.000）和注意类线索（r=-0.306，p=0.013）与监测精确水平存在显著负相关，其他变量与监测精确性的相关均不显著。这说明在对外语听力理解程度进行判断时，听者使用与情景模型相关的理解类线索越多，其元认知监测精确水平就越高；如果听者使用表层类和注意类线索越多，其监测的精确水平则越低，而且这种共变性并不受听力水平的影响。分析结果同时表明，记忆类、个人类线索与元理解监测精确水平呈正相关，虽未达到显著性，却可能预示着这两类非情景模型线索对监测精确性的影响未必是负面的。

4.3 外语听力元理解监测的延迟关键词效应

我们以关键词组别为自变量，分别以被试理解程度判断值和标准化测验成绩为因变量进行单因素方差分析，结果显示：判断值[F（2，63）=2.50，p=0.090]和标准测验成绩[F（2，63）=0.39，p=0.682]的组间差异均未达到显著性。这说明听完文章后是否写、即时写还是延迟写关键词对被试理解程度的判断以及标准测验的成绩并无影响。

本研究的另一主要目的是探讨外语听力元理解监测的关键词效应。为此，我们又以关键词组别为自变量，以监测精确水平（G系数）为自变量进行单因素方差分析，结果发现组别主效应仅接近边际显著水平[F（2，63）=2.67，p=0.077]。LSD事后比较结果表明，延迟关键词组与无关键词组的差异达到显著水平（p=0.046），与即时关键词的差异达到边际显著水平（p=0.051），但无关键词组与即时关键词组之间的差异不显著（p=0.970）。鉴于边际效应的存在，上述结果只是部分支持了关键词效应，但同时也从另一个侧面说明，写关键词的时间间隔对于听力元认知监测精确性具有显著影响。与不写关键词相比，延迟写关键词有助于听者提高对文章理解程度的区分和辨认能力，但即时写关键词不具有这一效果。

4.4 关键词质量对外语听力元认知监测精确性的影响

虽然写关键词的时间间隔对监测精确性具有显著影响，但关键词的正确率是否是除时间以外的重要影响因素，对此鲜有研究考察。为此，我们对即时和延迟关键词组的关键词成绩进行了独立样本T检验。检验结果显示，延迟关键词组和即时关键词组的关键词成绩存在显著差异[t（0.01）（39）=-3.35，p=0.02]，前者显著高于后者。这说明听后延迟写关键词能够有效帮助听者锁定正确的关键词，进而选择与情景模型相关联的线索对理解程度进行判断。为进一步验证这一假设，我们又采用Pearson相关分析分别对即时和延迟关键词组的监测精确水平（G系数）与关键词质量之间的相关系数进行了计算，结果显示即时（r=0.584，p=0.007）和延迟（r=0.704，p =0.000）关键词组被试的监测精确水平与关键词成绩之间的相关均达到显著水平。

5.综合讨论

近年来，有关元认知在外语听力理解中的作用受到了越来越多的关注，然而对听力过程的元认知监控研究却相对匮乏。本研究在借鉴阅读元理解测量方法的基础上，对外语听力的元理解监测水平进行了考察，并从监测线索与延迟关键词干预相结合的角度，对影响监测精确水平的内部机制进行了初步探索。

5.1 外语听力元理解监测的精确水平、线索使用特点及其作用

与本研究的假设一致，实验发现被试对外语听力理解程度的监测虽然总体上高于随机猜测水平，但远不够精确。具体而言，在无关键词干预的自然状态下，监测精确水平（G系数）的平均值仅为0.10；即便将延迟写关键词作为干预手段，平均值也未超过0.50。对被试自我判断的线索依据的直接测量结果表明，3组被试对理解程度进行自我判断时，使用表层、个人、记忆类等非情景模型线索的比例都超过50%，表现出与阅读元理解监测相似的规律（Thiede et al.2010；陈启山2009，2011）。更为重要的是，监测线索与精确水平之间的相关分析结果显示，只有与情景模型相关的理解类线索和监测精确水平显著正相关，而表层与注意类线索和监测精确水平显著负相关。这一结果在一定程度上是对“情景模型监测线索假设”在听力理解情境下的验证，同时也将情景模型线索表征理论从阅读元理解范畴扩展并延伸到了听力理解范畴。

至于上述结果产生的原因，我们认为，尽管听力与阅读同为语言输入，但听力最大的特点是即时序列加工，即听力过程中所输入的言语信息具有短暂、线性以及连续性特点，因此情景模型构建对语言熟练程度的要求更高。然而，外语学习者由于目的语知识和能力有限，致使他们在提取文本意义的过程中不得不随时调用大量认知资源参与整个情境模型构建，而这种非自动化的加工会对元认知监测线索选择带来不同程度的干扰，从而影响监测精确水平提高。例如，在分析监测线索依据时我们发现，不少被试倾向于根据生词数量、语篇难度、有无背景知识（即文章主题熟悉度）来判断理解程度，而不是从情景模型表征中提取线索。虽然语篇难度、背景知识等均与情景模型能否成功构建以及构建的完善程度相关，但语篇难度和背景知识并不能代表理解程度，只有听者采用与情景模型相关的理解类线索进行判断，才能排除其他线索干扰达到较高的监测精确水平。

以往有关元认知策略的研究也支持这种分析。有研究发现，高水平听者能够结合自身经验与知识背景对所听信息进行阐释和推理，而低水平者则更专注于琐碎的语言细节而不是全文的理解（O'Malley et al 1989；Shang 2005）。当然，这些从个体差异角度揭示听力理解中元认知策略重要性的研究只是停留在现象描述层面，对于策略形成、运用的原因和规律没有深入剖析。本研究对监测线索的测量和分析却从另一个角度提示我们，外语学习者在听力理解过程中普遍存在元认知监测障碍，而这种障碍可能与其判断理解程度时不能准确选择或使用情景模型线索密切相关。

5.2 对外语听力元理解监测能力的干预：关键词的延迟与质量

在众多元理解监测的干预措施当中，延迟写关键词使用最为广泛。作为一种对情景模型线索的强化手段，延迟写关键词的目的就是要引导个体从情景模型中提取相关线索对文本理解程度进行判断。究其原因，在延迟的时间内，由于表层表征线索（短时记忆信息）的消逝，被试倾向于从情景模型层表征（长时记忆信息）中提取线索，这些线索更利于其区分理解与不理解的内容。然而，自延迟关键词效应被提出以来，该领域几乎所有研究都是围绕阅读理解开展（Thiede et al.2005；Anderson & Thiede 2008），很少有研究探讨听力理解的延迟关键词效应。本研究结果显示，普遍存在于阅读元理解中的延迟关键词效应并非完全适用于外语听力理解。具体而言，本研究中关键词组别主效应并未达到显著水平，然而简单效应检验结果表明，延迟关键词组的监测精确水平显著高于无关键词组，延迟关键词组与即时关键词组的监测精确水平差异则仅达到边际显著水平。这一结果一方面反映了阅读与听力元理解之间的差异，另一方面也表明听力元理解极有可能存在不同于阅读元理解的线索加工特征。换而言之，尽管延迟写关键词对监测精确性具有促进作用，但这种作用的效果有限。这一论断主要基于以下原因得出。

首先，结合“情景模型线索假设”来分析，延迟写关键词要提高元理解监测的精确水平，整个加工过程需要具备两个基本条件。一是时间上的延迟，这是关键词效应产生的必要条件，因为时间的延迟能够让听者短时记忆中被“污染”的元理解判断线索消退。二是在延迟时间内写关键词，这是监测精确性提高的充分条件，因为写关键词能够促使听者重新对文本信息进行深入加工，并将由此获得的信息和线索作为元理解判断的重要依据。然而，写关键词与写对关键词对监测线索的强化效果显然不同。本研究中，延迟关键词组的关键词成绩之所以高于即时关键词组，是因为听者多从长时记忆（情景模型层表征）中提取关键词，故关键词质量高，线索强化作用明显，而即时写关键词仅从短时记忆（表层表征）中提取关键词，故错误率高，对线索的强化效果差。本研究只发现了关键词成绩对监测精确性的显著影响，而没有发现关键词的显著组别效应，其深层原因便在于延迟时间后的关键词产出质量可能对监测精确水平起着中介或调节作用。也就是说，尽管部分被试即时或延时写出了关键词，但由于关键词产出错误，致使未能重新激活与情景模型相关的线索。总之，关键词正确率应当成为听力元理解研究中除延迟时间和写关键词以外另一重要因素。

其次，从认知负荷角度来看，尽管阅读和听力具有很多共性，但由于听力材料的实时性，听力理解的工作记忆损耗比阅读理解更大（Buck 2001），因此造成听力理解和阅读理解工作记忆容量的差异，而这种容量差异有可能导致即时与延时情景模型线索回忆和提取路径、效果的差别。此外，延迟时间的长度也是一个不容忽视的因素。本研究中延迟时间设定为3分钟，这是国际通行标准，即约长于每篇文本理解的时间。然而，3分钟的延迟是否能够保证短时记忆中被“污染”的元理解判断线索完全消退，对此尚无从知晓。但另一方面，对于需要高度自动化加工的听力理解而言，延迟时间过长可能会导致长时记忆中存留的线索信息对情景模型的指向性减弱，而且线索的数量也会随着时间的流逝而减少。总之，今后还需更多的研究探讨“延迟关键词效应”在外语听力元理解监测中究竟起着什么作用，是否还可采取其他更为有效的线索干预措施等相关问题。

本研究得出以下主要结果：首先，外语学习者的听力元理解监测精确水平较低，这与其采用非情景模型类线索对理解程度进行判断密切相关。其次，延迟关键词组与即时、无关键词组之间的元理解监测精确水平差异均只达到边际显著水平，这一方面说明延迟写关键词对外语学习者元理解监测的促进作用有限，另一方面也表明听力元理解可能存在不同于阅读的线索加工特征。第三，无论在即时还是延时条件下，关键词质量与听力元理解监测精确水平均呈显著相关。上述结果对外语听力教学的启示意义在于：只有准确把握学习者听力元认知判断的线索加工特征，改变其错误的线索提取模式，才能真正提高元认知干预训练的效果，提高学习者的听力理解效率和水平。

标签：元认知论文; 文本分类论文; 文本分析论文; 信息加工论文; 关键词分类论文;

外语听力元理解监控准确性的研究_元认知论文

猜你喜欢