语体变异模式的多维度分析,本文主要内容关键词为:多维论文,语体论文,模式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、对各种语体的对比研究 语体分析总是对比性的。这就是说,语体特征就是在某种语体中出现得比较频繁的那些语言特征,当然,这需要与其它语体进行对比。通过对比,我们可以观察到语体由于受到情景因素的影响而产生的语言差异。从情景的视角来看,不同的情景因素形成了不同的语体,任何语体都有其特定的语言模式。那么,研究者怎样才能对某种语言中的全部语体进行对比,对语体的语言差异及其表现差异的特殊方式进行描写呢? 本章旨在对语体变异进行综合描写。我们将通过分析大量的语言特征,来考察语体变异的模式。这是传统的语体研究方法力所未逮的,因此,我们将介绍多维度分析法(multidimensional analysis)。这是研究语体的一种方法,它通过对大量语言特征的计量分析,确定用于语体对比的少量的基本维度,然后在所确定的维度下,对各种语体进行对比研究。它的研究目的是对某种语言的变异和使用情况进行全面地描写。 1.对语体的概括性描写 由于语体内部的不同语篇之间存在着变异,所以,对某种语体做概括性描写,必须以这种语体内部典型的语篇样本作为基础。如果我们无法确定某个语篇是否具有典型性,那么我们就不能以该语篇的特征来概括这种语体的特征。然而,因为在前面各章中,我们已经在大规模语料库的基础上对语体做过一些分析,因此,我们还是能够选出典型的语篇样本的。本章将重点介绍在大规模语料库的基础上,怎样对语体变异模式进行分析。 2.要考察的语言特征 研究者在进行综合性语体变异分析时,不仅要确定所要考察的语言特征,还要从多个维度展开对语体的详尽描写。由于目标语体的某些语言特征可能与A语体相似,而另外一些语言特征则可能与B语体相似,所以研究者只有在对多种语体的所有语言特征进行综合考察之后,才可能揭示出语体变异的多维度模式。 在下面的几节中,我们将通过对课堂教学话语与其它语体的普遍语言特征进行对比,来介绍基于语料库的语体研究。 3.对比某些语言特征在各种语体中的分布 对某些语言特征在各种语体中的分布情况进行对比,这是较为复杂的研究。我们将以课堂教学话语、会话、电子邮件、手机短信和教科书为例,通过对动词、名词、形容词、第一人称代词、第二人称代词、第三人称代词、状语从句、补语从句、关系从句等九种语言特征进行对比分析,来说明多维度分析的重要性。 研究者如果只关注动词、代词、状语从句或补语从句等语言特征,那么他可能会认为课堂教学话语与教科书不同,而与会话、电子邮件和手机短信更近似。但是,研究者如果能够同时考虑名词、形容词和关系从句等语言特征,那么他就会发现,从互动性的角度来看,课堂教学话语、电子邮件和手机短信都处于会话与教科书之间。 上述分析说明,单独从某个视角出发所进行的研究是不“准确”的,只有综合多个视角、从整体上考察语体的变异模式,才能得出全面的结论。本章就介绍这样一种方法——多维度分析法,它是对语体变异进行综合分析、对不同语体之间的语言特征进行全方位比较的方法。 二、多维度分析法介绍 多维度分析法(简称MD)是一种量化的分析方法,它能够同时对多种语体中不同的语言参项(即“维度”)进行对比。通过对语言维度的考察,我们可以发现语体差异存在的方式,并归纳出这种语言的语体变异的总体模式。 在多维度分析法中,每个维度都代表了一组共现的语言特征,这些语言特征在某些语体中频繁地出现,而在其它语体中则十分罕见。多维度分析法就是在实证和量化的视角下,分析那些与语体变异相关的语言特征的共现模式。 1.语体变异的多维度分析 多维度分析的目的有两个,一是通过实证和量化分析,确定某种语言的语体变异的潜在维度;二是在这些维度所确定的语言范围内,对口语体与书面语体进行对比。 多维度分析中的核心概念是语言特征的共现。我们将不同的共现模式视为不同的潜在的变异维度,而每个维度中所共现的语言特征,都是通过量化的方法确定的。多维度分析法中的因子分析法,是适用于更大范围内确定共现语言特征集合的方法,它是以大规模文本语料库中语言特征的分布规律为依据的。 然而,量化的方法尚不足以支撑语体变异的多维度分析。多维度分析法是建立在这样一种基本假设的基础之上的,即语篇中的语言特征之所以能够共现,是因为它们具有共同的功能。因此,多维度分析法的最后一步与传统的语体分析相同,就是参照语体在情景上的差异,从功能的角度对那些通过量化的方法确定的语言模式做出解释。例如代词、直接疑问句和祈使句的共现,就是因为它们都与语言交际的互动性有关。 多维度分析法还要借助语料库,要在大规模语料库中,采用计算机程序来分析语言特征的分布情况,然后通过因子分析确定语料中频繁出现的一系列共现的语言特征。这是一种自下而上的分析方法。研究者无法预先知道哪些语言特征将会共现,或者哪些功能最重要。确切地说,研究者是在语料库的基础上,采用实证和量化分析的方法,找出语体的语言特征的共现模式和变异模式,然后,再从功能的角度对这些模式加以解释。 2.多维度分析法概览 多维度分析包括以下六个步骤: 第一步:在前人研究和分析的基础上设计语料库,并收集合适的语料;说明每种语体的情景特点。 第二步:确定所要分析的一系列语言特征。 第三步:开发用于自动分析语法的计算机程序;对语料库中的所有语篇进行分析,计算出每个语言特征在语篇中出现的频率。 第四步:采用因子分析法,通过频率统计来确定、分析语言特征的共现模式。 第五步:计算每个语篇的维度分值;每种语体的平均维度分值将用于对比和分析语体在语言上的异同。 第六步:从功能的角度,对用因子分析法归纳出的“因子”或维度进行解释。 在因子分析中,大量的原始变项(即语言特征)被简化为一系列小规模的、可推导的潜在变项,即因子或变异的“维度”。每一个因子代表一组在语篇中具有共现倾向的语言特征。 在确定了维度之后,我们就可以对语篇中每个维度进行计算和量化分析,求得维度分值(dimension score)。这些维度分值使得我们能够在多维度空间中,对比各种语体的异同。 下面我们将以美国高校校园口语体和书面语体为例,详细说明多维度分析的具体步骤。 三、美国高校校园口语体和书面语体的多维度分析 多维度分析法的第一步是选择合适的语料库。本项研究的语料选自“托福2000口语和书面语学术语言语料库”(T2K-SWAL语料库,见比伯等2002)。该语料库大约有270万个词,包括美国高校校园中听、说、读、写的各种语体。表1(见下页)是该语料库中语体的总体构成情况。 多维度分析法的第二步是对那些可能与语体差异相关的语言特征的分布情况进行量化分析。多维度分析法所考察的语言特征,比传统的语体分析法所考察的要多很多。本项研究最终确定了90个语言特征,分为以下6类: 第一类:词汇分布(如一般名词或专业术语) 第二类:词性信息(如名词、动词、第一和第二人称代词、介词) 第三类:主要词类的语义类别(如行为动词、心理动词、存现动词) 第四类:语法特征(如名物化、过去时态、被动语态) 第五类:句法结构(如that引导的关系从句,to引导的补语从句) 第六类:词汇-语法组合(如受交际动词或心理动词支配的that补语从句) 多维度分析法的第三步是通过计算机的标注程序,确定并统计T2K-SWAL语料库中463个语篇样本的语言特征。 多维度分析法的第四步是因子分析,即用统计分析的方法来确定语料中潜在的因子(或维度)。每个维度都由语篇中具有共现倾向的一组语言特征构成,这些成组的特征在某些语篇中可能普遍存在,而在其它语篇中则极为罕见。 我们在研究美国高校校园语体时,确定了四个分析维度。表2列出了每个维度中重要的语言特征。需要注意的是,将哪些语言特征归为一组,这并不是由研究者决定的,而是通过统计分析来确定的,它们共现于语篇中。在这一点上,多维度分析法与传统的语体分析法存在着明显的区别。 表2中的四个维度都具有正负两方面的特征,它们可以分为两组,即在语篇中频繁共现的正向特征和负向特征。这两组特征呈互补分布状,它们共同构成一个维度。也就是说,在同一个语篇中,当正向特征高频出现时,负向特征就会低频出现,反之亦然。需要注意的是,这里的正负是数学上的正负,而非评价性正负。 多维度分析的第五步是根据每个语篇的维度分值,来分析语篇和语体的语言特征。维度分值的计算方法,就是把某个维度中共现的各项语言特征简单相加。①例如,维度1的分值,就是用维度1中的正向语言特征(见表2)出现的频率之和,减去负向语言特征出现的频率之和。只要将每个语篇中的维度分值都计算出来,我们就可以对比每种语体的平均维度分值。 在计算出维度分值之后,我们可以采用统计的方法进一步确定语体中是否存在有意义的、显著的差异。方差分析可以用来检验以上四个维度中美国高校校园语体的差异。检验结果如下页表3所示。 表3中F、p和的数据,说明了在对语体差异的分析中,以上四个维度都是重要的、有意义的预测因子。F值和p值显示的是方差分析的结果,表明上述语体的平均维度分值在统计学上是否具有显著的差异。如果P值小于0.001,就说明我们观察到的语体差异几乎不可能是偶然发生的(不到千分之一)。值表示语体差异的强度和重要性,它测量的是维度分值中方差的百分比,而维度分值是可以通过语体类别来预测的。例如,维度1的值说明90.7%的变异都可以通过每个语篇的语体类别来解释。这个数据表明维度1对语体差异的研究是有意义的,它是一个极其重要的预测因子。 多维度分析的最后一步是从功能的角度来解释每个维度。与单个的语言特征相类似,语言特征的共现模式也是功能性的。也就是说,语篇中共现的语言特征与它们所共有的交际功能相对应。我们主要根据以下两点来解释维度:一是共现的语言特征所共有的交际功能,二是该维度下语体的异同。表2已列出本项研究中四个维度的功能标记: 维度1:口头话语与书面话语 维度2:程式化的话语与以内容为中心的话语 维度3:对事件的重构 维度4:以教师为中心的立场 下面我们将对语体变异模式进行多维度描写,讨论每个维度内共现的语言特征集合以及美国高校校园语体的分布,并进一步考察这些特征在特定语篇中的功能。这些语体分别是:①服务接待时的会话;②办公时间的会话;③实验室中的会话;④学习小组讨论话语;⑤课堂教学管理话语;⑥课堂教学话语;⑦课程管理话语;⑧教科书;⑨课程资料;⑩机构话语。根据维度1,①-⑥为口语体,⑦-⑩为书面语体,表4同时呈现了它们在四个维度中的平均分值: 1.维度1:口头话语与书面话语 维度1反映了口头话语与书面话语的区别。在维度1中,正向特征(见表2)的功能一般都与口头话语有关;而负向特征大多涉及复杂的名词短语结构和被动结构,这些复杂的名词短语结构大多用于传递信息,被动结构则经常与这些复杂的名词短语结构共现。在这个维度中,语料库中所有的口语体都具有正向的高分值,反映出正向的、“口头”话语的特征;所有的书面语体都具有负向的高分值,显示出负向的、“书面”话语的特征。这样的分布出乎意料,因为上述语体在交际目的和有备程度上都有着显著的差异。 我们或许会这样猜想:课堂教学话语在维度1中的分值可能比较适中,它处于用来传递信息的书面语体与办公时间的会话、学习小组讨论话语这类口语体之间。然而,课堂教学话语在维度1中的分值却表明,它并不都是“书面”的话语。与教科书等学术性书面语体相比,课堂教学话语反而更接近学习小组讨论话语或服务接待时的会话等口语体。上述发现充分说明,实证性语体分析的结果可能与我们原先的猜想迥异。因此,在研究课堂教学话语时,我们需要对最初的情景分析重新进行考量。 2.维度2:程式化的话语与以内容为中心的话语 在维度1中,口语和书面语是二元对立的关系;而在维度2中,口语和书面语则共存于语体连续体中,人们可以对它们进行横向比较。如表4所示,在这个维度中具有正向高分值的语体,它们的交际目的都与学校的规则和程序有关。这些语体既包括口语体(如课堂教学管理话语、服务接待时的会话和办公时间的会话等),也包括书面语体(课程管理话语和机构话语等)。而那些格外关注信息内容的学术性书面语体,如课程资料和教科书,在这个维度中都是负向高分值。课堂教学话语和学习小组讨论话语在这个维度中的分值居中。 “程式化”的语言特征在口头的课堂教学管理话语中表现得最为充分,在书面的课程管理话语中也较为常见。而“以内容为中心”的语言特征主要表现为专业术语(如一些“罕见”的形容词、名词、副词和动词等)的大量使用。这些术语仅在某个特定的学科范围内使用。维度2的其它负向特征还包括简单的发生动词(如become,happen,change,decrease,occur)、可能动词+to从句结构(如seem/appear to…)以及量度形容词(如high,large)等等。这些共现的语言特征的高频出现,是学术性书面语体的典型特征。 3.维度3:对事件的重构 维度3与叙事性有关,主要表现为第三人称代词、过去时态、与人有关的名词、交际动词+that从句等语言特征(参见表2)。然而,上述特征也可能与一些表认知立场的语言方式共现,这些语言方式包括:可能性动词+that从句(通常是表不确定性的动词,如assume,believe,doubt,gather,guess,imagine,seem,suppose,think);表认知立场的名词+that从句(如conclusion,fact,assumption,claim,feeling,idea,impression,opinion,possibility,suggestion,suspicion)。 省略that的形式也可能与上述表立场的语言方式共现,它们常用于口语体及其它非正式语体中。 如表4所示,维度3中语体的分布情况与口语体、书面语体的差异直接相关(与维度1类似)。美国高校校园口语体比书面语体更具“叙事性”和“立场性”。 4.维度4:以教师为中心的立场 维度4中的语言特征大多与立场的表达有关,包括表立场的副词(如表确定性、可能性和态度的副词)、由表立场的名词控制的that从句(如the fact that …)。如表4所示,这些特征大多出现在以教师为中心的口语体中,如课堂教学管理话语、课堂教学话语和办公时间的会话等等。然而,上述特征较少出现在美国高校校园的书面语体中,几乎不出现在以学生为中心的口语体(如实验室中的会话、学习小组讨论话语或服务接待时的会话)中。 5.不同学科语篇之间的差异 如上所述,多维度分析法中的因子分析法,其作用是在分析语言特征分布规律的基础上,确定语言特征的共现模式。在确定语篇中具有共现倾向的语言特征时,因子分析法对语篇所隶属的语体不予考虑。也就是说,语体差异对因子的统计识别并没有影响。但是,采用因子分析所确定的这些维度,对语体差异的研究却有很强的预测力。这是因为语言特征的共现模式(因子分析的基础)和语体差异都是以功能为基础的。 维度的确立独立于语体类别之外这一事实,说明维度可用于探索目标语料库中具有代表性的任何下位语体的变异模式。本节将通过考察不同学科之间的课堂教学话语与教科书之间的差异来说明这一点。 在这项研究中,不同学科的语篇在维度2和维度3上都存在着一些有趣的差异。在多数情况下,工程学和自然科学语篇典型的语言特征非常相似。但是,这两个学科在维度2中的平均分值⑥却表明,它们在维度2中存在着显著的差异:无论是课堂教学话语,还是教科书,工程学语篇都非常“程式化”;而自然科学语篇则最能体现“以内容为中心”的特征。这种差异说明,工程学重在应用,而自然科学则更注重理论和描写。 与维度2中的模式相比,工程学和自然科学语篇在维度3中却表现出了一定的相似性⑦,即它们都倾向于采用非叙事性的方式传递信息。它们在维度3中的负向分值都很高,无论是在课堂教学话语中,还是在教科书中,情况都是这样。在上述语篇中,维度3中的正向语言特征十分鲜见,维度3中的负向语言特征却频繁出现,如数量名词(如表示长度、数量的名词)、具体名词(指称具体实体而意义较为专业的名词,如电子)等。负向维度的高分值反映了这两个学科在交际目的上存在着有趣地交叉,即这些高度专业化的语篇都需要用具体的例子来解释复杂的数理关系。 与此相反,与教育学、人文科学和社会科学有关的语篇,则更青睐于采用“对过去事件的重构”的叙事方式。这种叙事特征在这些学科的课堂教学话语中表现得最充分,在教科书中出现得也比较频繁。 本章通过对美国高校校园口语体和书面语体的描写,介绍了如何使用多维度分析法来考察语体变异的模式,包括如何使用这种方法来研究大量语言特征的共现模式,以及各种语体及其下位语体之间的关系。 通过对那些在语篇中共同发生作用的语言特征进行分类(也就是确定分析维度),我们不仅可以发现语体之间最重要的差异,还可以发现用其它方法进行研究时,人们尚未注意的、潜在的语体变异模式。 多维度分析法最引人注目的发现,可能就是口头话语和书面话语的区别。我们的研究是针对美国高校校园中的各种语体而设计的,所选语篇样本具有不同的情景特点,如不同的交际目的、不同的情景场合、不同的互动程度等等。然而,研究结果却表明,口头话语和书面话语是语体研究最重要的维度,它决定了美国高校校园语体语言变异的总体模式。 语体变异的多维度分析可以是多种多样的。我们既可以对英语中的口语体和书面语体的变异进行考察,如会话、广播节目、新闻报道、社论、小说等;也可以对其它语言中的语体变异进行考察,如索马里语、韩语、西班牙语等等;还可以进行更具体的多维度分析,如考察求职面试、小学校园语体以及语体的历史演变模式等等。在这些研究中,多维度分析法可以确定那些与语体的重要功能或情景差异相对应的语言变异的参项。由此看来,多维度分析法是一种用来描写语体变异模式的最有效的分析方法。 本文摘译自Douglas Biber and Susan Conrad的Register,Genre and Style(Cambridge University Press 2009)的第八章。——译者 附录:《语体变异模式的多维度分析》导读 《语体变异模式的多维度分析》摘译自Douglas Biber和Susan Conrad合著的《语体、语类和风格》(Register,Genre and Style)中的第八章。Douglas Biber是美国北亚利桑那大学应用语言学项目(英语系)的杰出教授,是“多维度分析(MDA)方法”的创始人。Susan Conrad是美国波特兰州立大学应用语言学教授,她的研究领域为英语语法和话语分析。该书在2009年由剑桥大学出版社出版,是剑桥语言学系列教材之一。全书包括以下几个部分:引言,第一部分“分析框架”,第二部分“语体、语类和风格的详细描写”和第三部分“更重要的理论问题”。全书除正文外,还有两个附录。 引言部分只有一章,即第1章“语体、语类和风格:语言的基本变体”。第一部分“分析框架”共有两章,即第2章“语体和语类的情景特点描写”和第3章“语言特征及其功能分析”。第二部分“语体、语类和风格的详细描写”共有四章,即第4章“人际口语体”、第5章“书面语体、语类和风格”、第6章“语体、语类和风格的历史变迁”和第7章“电子交际中的语体与语类”。第三部分“更重要的理论问题”共有两章,即第8章“语体变异模式的多维度分析”和第9章“语境中的语体研究”。作者在第8章中介绍了如何使用多维度分析法来考察语体变异的模式,包括如何使用这种方法来研究语言特征共现的模式,以及各种不同语体及其下位语体之间的关系。多维度分析法是研究语体变异模式的一种方法。它是在语料库的基础上,通过对大量语言特征进行计量分析,确定用于语体对比的基本维度,并在所确定的维度下,对各种语体进行对比研究。这里的“维度”指的是语言参项(linguistic parameters),每个维度都代表了一组共现的语言特征。作者认为这些语言特征之所以能够共现,是因为它们具有共同的功能。语言特征共现是多维度分析法中的一个核心概念。多维度分析法能够同时对各种语体中不同的语言参项进行对比。研究者通过对语言维度进行考察,可以发现语体差异存在的方式,并最终发现这种语言的语体变异的总体模式。作者提供了颇具操作性的多维度分析框架:收集合适的语料,确定所要分析的语言特征,计算出每个语言特征在语篇中出现的频率,分析语言特征共现的模式,计算维度分值,并从功能的角度对维度进行解释。作者以美国高校校园语体为例,从口头话语与书面话语等四个维度,对美国高校校园语体的变异模式进行了分析。作者的研究表明,在对美国高校校园语体的多维度分析中,口头话语与书面话语是最重要的维度,它决定了美国高校校园语体语言变异的模式。 多维度分析法可用于研究各种语体变异。它既可以用来考察某种语言中的口语体或书面语体的变异,也可以用来分析各种不同语言中的语体变异,还可以用来研究某个语体的下位语体或语体的历史演变模式。多维度分析法可以确定那些与语体的重要功能或情景差异相对应的语言变异的参项,因此,它是用来描写语体变异模式的最有效的一种分析方法。 ①特征计数以两种方式转换为可以比较的形式。首先,所有特征计数都被“归一化”,即它们在每1000个词中出现的频率。即使某些语篇比其它语篇长,我们也可以比较其语言特征的数量。其次,单个特征分值被标准化为平均值0.0,标准差为1.0(基于语料库中每一个特征的整体平均值和标准差)。这个过程将所有特征的分值都转化为代表标准差单位的层级。因此,按照绝对值来计算,语言特征无论是极为罕见,还是极为常见,标准分值+1都代表这些语言特征超过平均分值一个标准差单位。也就是说,标准化分值测量的是,相对整体平均频率而言,一个特征在语篇中是常见的,还是罕见的。归一后的频率被转化为标准分值,这使得一个因子的所有特征在维度分值的计算中都具有同样的权重。比伯(1988)曾详细描述过归一化和标准化频率统计以及计算维度分值的方法和步骤。 ②指介词短语中的名词短语被移走后,剩下的介词变为流落成分,如“Who did you give the book to?”中的“to”。详见戴维·克里斯特尔编、沈家煊译《现代语言学词典》(2011,336)。——译者 ③指介词短语后置修饰名词的情况。——译者 ④原文为“size adjectives(e.g.high,large)”。——译者 ⑥参见Douglas Biber and Susan Conrad(2009:242)。——译者 ⑦参见Douglas Biber and Susan Conrad(2009:243)。——译者文体变异模式的多维分析_语料库论文
文体变异模式的多维分析_语料库论文
下载Doc文档