生物语言学的新进展:存活最简理论,本文主要内容关键词为:语言学论文,新进展论文,理论论文,生物论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
上世纪70年代乔姆斯基的研究转向个体生态学,称为生物语言学第一次复兴。当前生物语言学的再次复兴得益于近期语言学和生物学等多个领域的发展,其一是FOXP2基因的发现使得比较认知科学能够致力于动物心智和语言能力的研究,这一自下而上的机制探索更符合神经科学和进化生物学的方向(Boeckx 2011:452);其二是对语言的跨学科性认识使得语言学家认识到神经科学和语言学之间缺乏共同层面的表征(ibid:454);其三是最简主义的出现使得语言学研究结束了语言学与其他认知和生物科学的隔离状态(Boeckx & Grohmann 2007:1-8)。Boeckx,Stroik和Putnam等生物语言学家根据进化科学关于人类语言从原始语言发育到现代语言相对于人类进化的历史只是很短一段时间的结论,从进化生物学、物理学等科学成果汲取营养,对“标准最简方案”大胆质疑,提出“存活最简理论(survive minimalism)”,从理论上回答了原始语言何以能够冲破人类语言发展所要求的生物工程限制而快速发育到现代语言这一问题,在实践上也解决了不少标准最简方案解决不好的句法问题。 2.标准最简理论的语言机能结构设计 Chomsky(1995)的最简方案(又称“标准最简方案”)假设语言机能(FL)要求4个独立的次系统:感觉运动(sensorimotor,SM)系统、概念-意图(conceptual-intentional,C-I)系统,词库(LEX)和计算系统(CS)。感觉运动系统发出和接收语言信号;概念-意图系统解释语言信号;词库储存词汇信息;计算系统从词库储存的词汇生成复杂的语言结构,如图1: 在图1所示的设计中,行为系统外在于语言系统,因此计算系统生成的语言结构要“转移”或输送到行为系统进行解释。标准最简方案有大量的操作机制,其中被研究者广为接受的是合并操作机制:Merge{α,β}→[αβ]。Chomsky(2009:29)认为合并是没有限制的,允许任何两个成分合并在一起。除合并操作外,一些最简方案版本(如Chomsky 2000)还有一个一致性操作,这个操作允许一个成分核查(probe)另一个成分(goal)的匹配特征,用来解释诸如There appear to be six very hungry children sitting at the kitchen table中主要动词appear与嵌入主语six very hungry children间的一致关系。但关于一致性操作何时使用的问题存在争论:究竟是在一个语段中心语合成之后还是在句法派生(SD)完成之后才使用? 标准最简方案认为所有成分都是互相独立的,每一个成分都有它自己的内部运作系统,从一成分到另一成分要有必需的传输器,这就增加了语言机能的负担,对于原始人类语言在很短时间段内进化成现代人类语言这一生物学发现就缺乏解释力。另外如果系统成分是互相独立的,在概念上就可能有冗余和不协调。Frampton & Gutmann(2002)就证明,标准最简方案的计算系统和行为系统不相容,于是就产生“崩溃”(crash)结构。这种情况表明,标准最简方案的模型设计很难说是最佳设计。 3.存活最简理论的语言机能结构设计 Boeckx(2006)、Stroik & Putnam(2013)等研究认为,标准最简方案只研究计算系统操作,是以自然选择观探索语言机能。但自然选择本身不是进化的基本原则,机体内部因素的限制才是决定和影响表型选择的根本动因(Fodor & Piattelli-Palmarini 2010:21)。根据Turing(1952)的理论,最简单、最经济的语言机能体系结构操作必须具有设计适当性,必须对人类语言机能的形态以及语言如何出现于物种的问题做出解释。Stroik & Putnam(2013)根据这一理论,认为标准最简方案的体系结构设计(图1)不仅在操作上存在问题,在理论上也存在问题:1)该体系的结构设计要求生物学系统(计算系统)满足其他“外在”系统(感觉运动系统和概念-意图系统)的解读需要,有违生物发育基于机体内部限制的假设(Fodor & piattelli-Palmarini 2010);2)该设计中的句法系统和语义系统是互相独立的系统,不能从概念上保证句法的语言输出能为先语言的概念-意图系统所用;3)感觉运动系统和概念-意图系统之间没有连接,这就意味着语言前原始人因为缺少计算系统和词库而没有办法连接两个行为系统(PS)。据此,他们提出了图2所示的体系结构设计,将计算系统置于行为系统中,这就可以对现代人类语言何以能够这么短时间从原始语言进化而来的问题作出回答,因为如果所有动物的交际系统都如图2那样处于行为系统内,词汇特征就不必被输送到感觉运动系统和概念-意图系统进行可读性核查,因为它们必然与这些系统兼容,这样原始语言发育到现代人类语言就不必再建立新的(语言)系统,就可以解释原始人类语言何以能够在短时期内进化到现代人类语言。 4.存活最简理论的词库结构 在标准最简方案中,词库(LEX)与行为系统无关,词项(LI)必须被行为系统核查其词汇特征的兼容性才能到达接口(interface),句法可以从算式库中盲目选出的词项派生出来。由于词项是盲目选择的,结果会导致大量崩溃句法。而存活最简理论的设计将所有词项都置于行为系统内部,词项具有内在可解读性,每个词项都由一套层级性的、有结构的特征矩阵(FM)定义,基于词项共有的行为系统特征(PSF),可以将red和blood整合成red blood、将two和cat(s)整合成two cat(s),甚至有可能交叉整合,如将smell这一行为的感知特征与物体meat整合构成smell meat。Chomsky虽然也赞成词项包含一个特征集,但是这个特征集是线性的〈fl,.,fn〉,而存活最简理论的特征集是层级性的、有结构的,每个词项由一套特征矩阵定义。例如,LIcat具有临时的可数特征,LItwo具有必然的数特征,前一特征会选择后一特征把两词汇项进行特征连接,创造出two cat(s)。由于选择性(临时)特征取决于被选择性(必然)特征,这些特征在一个特征矩阵中形成有层级的组织结构:〈selecting PSFs〈selected PSFs〉〉。也就是说,被选择性特征在特征矩阵中的层级低于选择性特征。定义词项概念要件的被选择特征扩展(而非定义)其选择特征,词项的被选择特征比附加在它们上面的“新”特征更古老。因此这个结构具有进化论意义。 英语话题化的介词短语(PP)总是成为语障,阻碍从中提取所有实体,例如: 冻结效果显示的语迹移动问题可以用存活最简理论的特征矩阵简单而直接地消解:不规则性可以解释为由于一个形式特征的出现而得到允准。Muller(2010:17)提出这样一个特征层级结构来解释防冻结效果:∑〉〉D〉〉top〉〉wh〉〉。也就是说,词项的不规则特征∑的存在决定了(2)中VP的不规则提取,使其最终移动到句首,实现话题化。 人类祖先行为系统(认知和运动能力)的发展,使词项单位被分解为概念和感知特征,包括属性特征(如smell,color)、量特征、空间(locative)特征、时间特征,等等。例如LIcat会有〈animate〉这个被选择特征,确认猫是动物,但还有〈color〉这样的选择特征。人类随着不断进化,会把这个认知能力扩展到正在发展的语言世界,根据词汇的特征确认词项,从而生成句法。词汇特征包括:1)确认与一词项共现的范畴特征的特征(如论元特征),称为次范畴特征(SUBCAT);2)形态句法和句法语义特征(如话题特征),称为行为系统特征(PSF);3)词项独有的、确认其句法范畴的特征(如[+V]、[+N]、[+P],称为范畴特征(CAT)。 5.存活最简理论的算式库设计 标准最简方案的算式库(NUM)存在的一个重大问题是它在句法派生开始前就得穷尽性决定,也就是说,句法派生盲目地选择词项。如果一个算式库包含10个随意词项(NUM={LI1,…,LI10}),其中的每一个词项(Lli)最终都要写入SD,能够生成360万个结构串,自然会产生崩溃结构。Epstein & Seely(2006:Chapter 5)就认为(4)中Step 1导致的崩溃是派生VP的必然结果,只能在下一步派生中修复。 (3)Rats eat cheese (4)a.Step 1:*[VP[V eat][DP cheese]] b.Step 2:[vP rats v-eat[VP[V eat][DP cheese]]] (4)中的Step 1建构的VP违反了题元标准(θ-criterion),因为eat没有完全释放其题元角色,VP移位到接口时,会在逻辑形式接口处具有不可解读特征,导致“崩溃”。这种情况在Step 2得以修复,主语rats进入派生,允许第二个也是最后一个题元特征赋值。也就是说计算系统必然会产出崩溃的输出。 尽管如此,存活最简理论认为不能在设计中放弃算式库,因为,1)词库中的词项缺乏形式特征,没有算式库计算系统无法直接把词库中的词项映射到感觉运动系统和概念-意图系统接口;2)没有算式库,计算系统无法决定派生何时终结;3)计算系统包括短期记忆计算,算式库是句法派生所用词项的短期记忆库;4)词库是一个巨大的域,没有算式库,处理成本太大;5)放弃移动类句法操作后,没有算式库就不可能保证移位效果的派生解释。存活最简理论虽然将算式库独立于计算系统,但它不仅仅是词汇仓库,而是一个动态工作空间,积极参与计算系统。如: (5)a.Merge{see,who}→see who b.Merge{Maggie,{see,who}}→Maggie see who c.Merge{will,{Maggie,{see,who}}}→will Maggie see who d.Remerge{who,{will,{Maggie,{see,who|}}}→who will Maggie see who 粗体的wh-词表示这个词具有未核查特征,可以再合并到派生以使其特征适当核查。如果没有算式库,这个词项多次合并到派生是不可能的。 既然算式库与计算系统分离是产生大量“崩溃”结构的重要原因,解决崩溃问题的最佳方法就应该如图2那样将词库、感觉运动系统以及计算系统相互联系地置于行为系统(感觉运动系统/概念-意图系统)中。句法(SYN)特征不是可以删除的形式特征,而是连接(匹配)特征,所有句法特征与所有语义(SEM)和语音(PHON)特征一样本质上都必须是感觉运动系统/概念-意图系统可解读的。计算系统在派生的每一步都把行为系统材料(PSI)映射到行为系统结构(PSI*)。 存活最简方案扬弃任何回溯操作(如Chomsky的语段不可入条件操作),以避免这些操作过远回溯句法派生而造成产出不合法的结构,确保计算系统产出合法行为系统输出,防止崩溃。存活最简方案只允许或者说只需要一种句法操作:复制和连接,即把成分从词库复制和连接到算式库、再从算式库复制和连接到派生结构。之所以操作简单,是因为与计算系统互相联系的算式库具有三个基本属性:1)算式库的词项不是派生前盲目选择的;2)算式库在派生过程中建构;3)算式库位于行为系统内部。 存活最简方案的算式库中的词项不是在派生前而是在派生过程中选择的,没有不可解读特征,其中每个词项都包含一个层级性的、有结构的特征矩阵,句法派生需要的连接特征可以直接复制到派生结构,未连接(匹配)的特征使该词项继续在算式库中“存活”,可以再次复制,以满足行为系统的连接需要,直至全部特征被核查。 标准最简方案的一个主要预设是词库和算式库外在于行为系统,词项到接口处时方可辨识,那么有些现象就难以解释,例如: 在(6)中,LIwho 一开始是动词hire的宾语,在派生结构中短距离向左移动,每一步标记为语迹t。LIwho发生移动是因为各种语段中心语可以具有边缘特征(Chomsky 2001,2004),允准一套结构定义成分移动到中心语短语(HP)的左端。此例中v中心语和C中心语的边缘特征吸引wh-成分移动,累积起来的结果是长距离移动。如果边缘特征在“接口”不可见,那么这些中心语的边缘特征如何习得?如果是可习得的,就必须从别的地方(比如分析程序[parser])而不是接口处习得。但是分析程序要发现与wh-成分的直接语迹位置关联的特征,只有反过来回溯派生的历史记录。有了具有特征矩阵的算式库,计算系统自下而上地进行特征匹配连接,一步步复制,该问题就会得到解决。但这又会出现(7)和(8)的问题: (7)a.This woman b.[DP[D this][NP woman]] (8)This woman loves me. 如果(8)是自下而上建构的,派生要到达VPloves me建立起来的点上,(7)b建构起来的限定词短语(DP)this woman才需要引入派生,这样限定词短语就无法像(7)b那样单个词添加到VP,因为如果单个添加就会失去限定词与名词之间的结构连接。那么就不得不增加类似回溯的计算程序。为什么要这么做?更重要的是,如何这么做?存活最简理论的算式库可以解决这一问题,因为它的算式库是在派生过程中根据派生需要建构的,限定词短语可以根据需要在派生之外某个附加的工作空间建构,然后整个复制到派生。这个附加空间称做工作台(WorkBench,WB),句法算子把算式库和工作台的结合(NUM U WB)作为一个域参与派生,这就保证了限定词短语的结构完整性。 6.存活最简理论的计算系统 生物进化学的研究表明,猴子大脑中的F5区有一些镜像神经,在它们做一些动作或观察其它动物做同样动作时就会做出反应(Stroik & Putnam 2013:73-74)。人类大脑中布洛卡区与猴子大脑中的F5区有类似的镜像系统(mirror systems)协调言语(Corballis 2010:119)。原始语言的词项具有选择特征和被选择特征,而句法有限,将词汇的选择和被选择特征结合起来,就构成了能产的词汇链帮助语言表达,比如把smell的被选择性感知特征与meat的选择性感知特征结合起来构成smell meat。这一能力利用的是人类祖先运动系统中涉及的“镜像系统”的“复制能力”(Stroik & Putnam 2013:73-74)。据此,存活最简理论认为,计算系统要将算式库中的词汇材料引入到派生,最有效的方式是使用复制操作。因此存活最简理论把计算系统简化为(根据特征连接进行的)复制(Copy)操作。 由于存活最简理论的词项特征是层级性的、有结构的特征矩阵:〈SUBCAT-f〈selecting PSFs〈CAT-f〈selected PSFs〉〉〉〉,如果“Otto was hired”要从算式库NUM{T,was,hired,Otto}派生出来,第一步是把动词hired带入计算工作空间,投射动词的特征矩阵:“Merge{hired〈passive,PATIENT thematic argument〉,}→[hired]〈passive,PATIENT thematic argument〉”。可以看到动词(至少)有两个特征:一个是带PATIENT论元,一个确认该动词为被动分词。第二步是复制限定词短语Otto到派生,这个限定词短语的题元角色可以与该动词的特征连接:“Merge{Otto〈Case,thematic role〉,[hired]〈passive,PATIENT thematic argument〉}→[hired Otto]〈passive〉”。接下来动词投射〈passive〉特征。DPOtto尚有一个“存活”特征〈Case〉留在算式库中,留待后续复制,直至所有词项的所有特征都被连接、失效(不再在算式库中“存活”),最后派生成为合法表征,概念-意图系统会将其解读为一个事件,其中DPOtto是动词的“逻辑宾语”;感觉运动系统将DPOtto解读为“语法主语”。 (9)存活原则(Stroik 1999:286): 如果Y是一个以X为中心语的XP中的句法目标(SO),且Y有一个未核查的与X特征不兼容的特征[+F],那么Y在算式库中继续存活。 这个仅有复制(Copy-only)的操作方案比标准最简方案更精简。一个派生从第一个词项置入它开始,被具有层级结构的特征矩阵FM〈fi〈…〉〉定义并投射层级结构的FM〈fi〈…〉〉。一个派生的特征矩阵在派生的每一步都由一个最高层级特征fi定义,并充当“边缘特征”(EF)以指令一个派生如何进行。重复这个操作可以派生下一个被另一边缘特征定义的派生结构,如(10): (10)Copy-to-SD(CoSD): Copy{α〈fi〈fn...〉〉,[SD1〈fi〈fm...〉〉]}→[SD2 α SD1]〈fk...〉。 (k=n或m,根据哪一个特征层级最高) 在存活最简方案下,“复制至算式库”操作(CoN)在派生过程以逐个方式编制词项的算式库。词项有三种层级结构特征:次范畴特征、行为系统特征和范畴特征。这些特征是连接特征,必须通过“复制至派生”操作(CoSD)核查,核查必须遵循明确定义的次序〈SUBCAT〈PSF-selecting〈CAT〈PSF-selected〉〉〉〉,先核查非内嵌(较高层级)特征,再核查内嵌特征。如果句法派生从一个缺少次范畴特征的开始,或者说X不是派生最下层的成分,那么该派生就不是一个自下而上的过程。在自下而上的派生过程中,一旦X被引入派生,其特征矩阵(〈SUBCAT〈PSF-selecting〈CAT〈PSF-selected〉〉〉〉)就对派生进行特征指令,指导派生如何进行,直至完成派生。 Chomsky的边缘特征(EF)是没有内容、允许句法成分依附于结构边缘的特征。而存活最简理论中的边缘特征是特征矩阵的有内容成分,是其中的最高层级特征,因此可以引导派生程序的方向,即“复制至句法”操作具有复制方向一致性(CUD)。这意味着NUM-X从{A}开始,然后成为{A,B}、{A,B,C},最后是{A,B,C,D}。有了复制方向一致性,行为系统就不必一个个分检排除无效派生,句法就可以防崩溃。 简而言之,存活最简方案的优势在于:1)只有局部操作,不需要任何过滤/经济机制来限制过于强大的非局部操作;2)可以不求助于移位操作解释移位现象。 7.存活最简理论的解释力 存活最简方案不仅能够较好地解释一般句法派生问题,还能够解释标准最简方案很难解释的辖域、虚词(expletive)结构、附加结构和并列结构。对于后三类结构的派生解释,存活最简方案从论元关系分析入手: (11)Moe will give a beer to Homer. (11)中give有两个次范畴特征:SUBCAT-P和SUBCAT-D,第一个由介词短语([PP[P to][DP Homer]])中心语的范畴特征(CAT-P)匹配,第二个由限定词短语([DP a[NP beer]])中心语的范畴特征(CAT-D)匹配。如果(11)的句法结构主要依靠次范畴特征与其论元的范畴特征匹配,那么如何向派生引入这些限定词短语论元都没有关系,因为它们都有等价的范畴特征。这就出现了一个问题: (12)??Moe will give a beer Homer. (12)的问题在于限定词短语的论元位置。但既然beer和Homer都有等价的范畴特征,为什么不能自由排序?一定是因为限定词短语还有范畴特征以外的区别性特征。如果把论元关系作为因素计入派生,这个问题就可以解决。也就是说,次范畴特征具有子特征(sub-feature),有了这种子特征,论元角色和句法计算的复杂关系就可以简化。动词give的特征矩阵不仅要辨识其两个次范畴特征,还要定义该谓词次范畴特征施加的论元角色。这些角色作为子特征附属于次范畴特征:〈SUBCAT-D:RECIP〈SUBCAT-D:PATIENT〉〉。 虚词要复制到派生,就必须被某个句法目标选择,这就要求虚词有论元角色。由于虚词特征矩阵非常小,没有论元特征,因此不能出现在论元位置,但可以到“纯一致性”特征的位置。如There is someone waiting outside in the rain中,虚词there只有格(case)特征,被复制到时态投射([T[is someone waiting outside in the rain]])派生,使其格特征得以核查。someone接下来再次被复制到派生,确保其人称和数形态特征(phi-特征)和时态投射的phi-特征适当连接。there-虚词结构和it-虚词结构在存活最简方案的分析中有相同之处,即都没有范畴特征或次范畴特征,但它们的特征矩阵具有不同的行为系统特征:前者只有格特征,而后者既有格特征也有人称和数形态特征。两个虚词因特征矩阵不同而不能够互换:*It is someone waiting outside/*There seems that Lisa left。 附加语是充当其他句法单位修饰语的单位,“没有多少句法”(Hinzen 2009a:43),因此在标准最简方案中大多被消极刻画(Hinzen 2009b:137)。它不接收论元角色,也不参与一致性系统。 (13)a.Bart jogs because he wants to. b.Bart fell under the table 根据Hinzen(2009a:44),附加语可以解释为简单谓词,如“walking quickly意为一个walking事件[e],and it is quick”:walk quickly:(e)e is a walking and e is quick。那么(13)a可分析为:(e)eis a jogging and e is because he wants to。但是对(13)b这样分析就不合适,因为该附加语不是谓词,无法被解读为涉及时间和方式的事件。存活最简方案把附加语分析为事件的参与者,与主语论元的参与方式类似。 (13)a′e[e is a jogging & AGENT(Bart,e)&REASON(because he wants to,e)] (13)a'较好地刻画了(13)a中的附加语是“慢走”的原因,其中的附加语参与动词事件的论元关系,是事件的参与者,由它们的论元角色定义。这样(13)b即可得以有效解释。存活最简方案对并列结构的句法派生解释可参见Stroik & Putnam(2013:114-129)。 8.存活最简理论的理论意义及其对语言学研究的启发 生物语言学家Boeckx(2009:46)指出,任何考虑语言发育问题的人都会同意……它发生在一个很短的时间段内,生物语言学必须对这一现象作出解释。存活最简理论根据生物进化科学及其他自然科学的研究成果,提出新的语言机能设计,从理论上回答了这一问题。Chomsky(1995)曾在最简方案中提出由自上而下转变为自下而上的计算和派生模式,从词项开始建构句子结构,但是还是没有成功清除以前句法模型的表征成分,继续用移动或内部合并解释移位现象。尤其因为其词项是任意从算式库选择的,所以没有办法预期派生最终何时结束。那么,句法派生如何开始?如何继续?每一次连接后句法单位投射什么?如何终结?为什么终结?存活方案解决了这个问题。存活最简理论能够对这些任何一个在理论上都不那么容易回答的问题做出统一回答,具有重大的理论意义,从而给生物语言学乃至其他视角的语言科学研究一个重要的启示:基于自然科学研究的语言研究是揭示语言本质的最有效途径。 在方法论方面,存活最简理论从进化科学的研究成果得到启发:如果人类语言机制的计算系统像标准最简方案设计的那样复杂,从原始语言发展到现代语言的进程不可能那么快。于是存活理论假设语言的计算系统位于行为系统之内(如图2),从这个假设开始设计计算系统(其复制系统的设计就是基于生物进化科学关于原始语言是由镜像系统发展而来的理论成果),提出以重构操作和原则的方法解决冗余句法结构问题(Hornsstein 2009)。这正是量子缠结“隐蔽变量”的分析方法。从目前已有的研究成果看,这一新的设计较好解决了不少标准最简方案解决不好的问题,比如句法崩溃问题、辖域、虚词结构、附加结构和并列结构问题。语言学既然是科学,自然科学的研究方法自然也应该适用于语言学研究,诚如Boeckx(2011:458)所说:语言科学要跳出入文科学思维,心理学已经这样做了,语言学也不能够例外。在这一点上存活最简理论的研究方法对语言学研究的意义至关重大,为中国语言学界尤其是以汉语为研究对象的语言研究形成有特色的、能够走向世界的理论模型提供了十分有益的启发。 存活最简理论给语言学研究的另一个启发是,语言学研究要想得到长足发展,必须整合理论,摒弃门户之见。存活最简理论同意句法表征是意义表征,句法不能独立于语义,其相关研究就曾多次借助关联理论对认知效果、认知意义以及句法与认知效果计算之关系的研究(Stroik & Putnam 2013:13-14,134-135,160),并直接将人类行为系统(认知和运动能力)的概念和感知特征如属性特征(smell,color)、量特征、空间特征、时间特征等纳入存活最简方案的词项特征矩阵。Stroik & Putnam(2013:73-74)直陈:把词汇的被选择性特征与选择性感知特征匹配起来的能力不是专属于语言的,而是人类祖先运动系统中“镜像系统”的一般“复制能力”,这与第二代认知语言学关于语言不是自主的观点已经很接近。生物语言学的领军人物Boeckx甚至直言不讳地指出:传统立场认为不同理论见解之间是竞争关系,比如在乔姆斯基与非乔姆斯基语言学之间、形式与功能方法之间常常进行对比。每一个理论视角都会对了解复杂的人类语言机制有所帮助,采取多元态度不仅使我们能够进展更快,还能使这个领域有一个统一的面貌和感受。每一个理论都要认识到我们有些地方是错的。生物语言学要繁荣,理论排他的时代就必须结束(Boeckx 2011:457)。从这几个方面看,存活最简理论不仅是生物语言学研究的重大发展,也为语言学研究建立新的范式做出了贡献。生物语言学的新发展:最简单的生存理论_限定词论文
生物语言学的新发展:最简单的生存理论_限定词论文
下载Doc文档