如何看待今天的生物语言学方案,本文主要内容关键词为:语言学论文,如何看待论文,生物论文,方案论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1 引言①
在讨论“语言”之前,我们必须要清楚我们用这个术语来指什么。它有时用来指人类语言,有时又用来指任何的符号系统,或任何交际、表达的模式。例如当一个人说“蜜蜂的语言”,或“程序语言”,或“星星的语言”等。在这里,我将沿用其第一个意思,即“人类语言”,生物世界里的一种特定对象。正是基于这样的理解,语言研究被称之为“生物语言学”的视角。
在关于语言的诸多谜题之中,有两个是特别突出的:第一,究竟为什么会存在语言?第二,为什么会有这么多的语言?
2 为什么会有语言?
按照古人类学家和考古学家们所达成的普遍共识,上述问题在进化史上出现的时间相当晚近。第一个问题在大约十万年前还没有出现,因为那时根本没有语言。这两个问题的答案大约在五万年前得以确定:我们的祖先从非洲出发,长途跋涉,分散到世界各地。就目前所知,语言官能本质上自此一直保持没变,这在这么短暂的时期内并不奇怪。一个来自亚马逊石器时代部落的婴儿,如果被带到波士顿,就其语言功能和其他的认知功能而言,与那些出生在波士顿的,其祖先可以追溯到最早的英国殖民者的儿童没有什么区别,反之亦然。具体日期②不是很清楚,而且对我们也并不重要,但总的图景却大概是准确的。
我们因而关注令人好奇的生物客体:“语言”。它在地球上的出现离现在相当近。它是人类的一种物种属性,是一种共同的天赋才能,在没有严重病理原因的情况下,这种共同天赋没有任何重大差异。就其本质而言,它与有机物世界中其他任何已知的事物不同,自其出现之时起,就理所当然地成为人类生活的中心。它是现代进化理论的奠基人之一阿尔弗莱德·罗素·华莱士所说的“人类智力和道德本质”的一个中心部分:是人类用于创造性想象(通常指语言和符号论)、记录和解读自然现象、复杂社会实践以及类似问题的能力,是一种有时被简单地称为“人的能力”的复合体。这个复合体变得清晰似乎是在相当晚近的时候,在非洲东部的一个小小群体中产生的,而我们都是这个小小群体的后代。它使得现代人与其他动物截然区分开来,这对整个生物世界都产生了巨大的影响。一般假设,而且也有理由假设,语言的出现是这个突然的戏剧性转变过程中的一个核心要素。此外,语言还是人类能力的一个组成部分,这一能力可以使人在某些方面进行深入学习。我们对“智力和道德本质”的诸多一般原则虽然还不是十分了解,但它们却在我们的生活中起着至关重要的作用,而且,毋庸置疑,它们在某些根本方面根植于我们的真正本质中。用大卫·休谟的话来说,它们经由“自然的创造之手”而来到我们中间。这一点虽常遭否定,但在我看来,这些否定并不可信。
从生物语言学的视角来看,我们可以从本质上把语言看作一种“身体的器官”,它或多或少与视觉系统、消化系统或免疫系统相似。正如其他器官一样,语言是一个具有足够内部完整性的复杂有机体的组成部分。因此,在有机生命中将语言与那些具有复杂相互作用的其他系统区分开来加以研究是有道理的。就此而言,它是一个认知器官,就像用于计划、解释、反思的系统,或像其他任何别的属于可以被笼统地“称作是心智的”那些方面的系统一样,用十八世纪科学家和哲学家约瑟夫·普瑞斯特里的话来说,这些系统由于某种原因被限制在“大脑的有机组织结构”这一范围之内。他继牛顿的实验论证之后,清楚地表达了这样的自然结论,即世界并非是一部机器,这一点与十七世纪科学革命的种种核心假说相反。这一结论有效地排除了传统的“思维——身体”的问题,因为不再存在一个关于“身体(物质的或物理的)”的清楚一致的概念,这个问题在十八和十九世纪曾得到过很好的探讨。我们可以认为语言是一种心智器官,这里的术语“心智的”指的不过是世界的某些侧面,我们可以用一种像研究化学、光学、电子或其他学科方面的方法一样,对它们进行研究,以期达到最终的统一:在过去,它常常是以一种完全意想不到的方法实现的,而不一定是通过还原法。
我在此并不打算探究这个问题,但有趣的是,这种后牛顿主义的理解最近被戏剧性地作为新生物学的论题重新发现和讨论:“心智(实际上就是思维)是大脑突现的特性,(虽然)这些特性的突然出现是由那些我们还不理解的原则所引起的”。我这里引用的是神经科学家弗农·蒙卡斯尔概述美国人文科学与自然科学研究院为总结上一个千年而进行的“大脑十年”评点活动时所讲的一番话。其他一些杰出的科学家和哲学家们最近也描述了相似的论题,例如关于新生物学的一种“惊人假设”、思维哲学中“激进”的新思想、“一种关于心智现象完全是自然的,是由大脑的神经生理活动导致的大胆断言”等,他们开启了一扇新颖而富有前景的、抛弃笛卡尔思维——身体二元论等思想的研究之门。从思维——身体的二元论随着关于身体(或物理的、物质的等)的唯一、一致概念的消失而变得不可论证后,所有这些声明用一种同质的话重申了几个世纪前的理论表达。这些事实使我们回想到很多社会和政治生活方面的事情,思维生活领域也是一样:忘记历史是不明智的。
3 为什么会有不止一种语言?
正像我在开头提到的那样,关于令人好奇的心智器官语言,出现了两个明显的问题。一个是它究竟为什么会存在;第二是为什么会有不止一种的语言,事实上就是为什么会存在如此众多的状态和多样性,各种语言之间似乎“没有限制地,而且以不可预测的方式而不同”,每种语言的研究因此必须以这样一种思路来进行:“没有任何关于一种语言必须是什么样子的事先存在的图式”。这是一个50年前惹人注目的理论语言学家马丁·朱斯在总结占统治地位的“鲍阿斯传统”(像他所合理地称呼的那样)时所做的理论陈述,他将之溯源到现代人类学和人类语言学的奠基人之一弗兰斯·鲍阿斯的作品。作为美国结构语言学在20世纪50年代的奠基性著作,塞林格·哈里斯的《结构主义语言学的方法》被称之为“方法论”,这是因为关于语言,它除了关于将无限差异的各种语言数据削减为有组织的形式之外,似乎没有说什么东西。欧洲结构主义也是一样。尼古拉·特鲁别茨柯依关于音系分析的经典导论在概念上与此相似。简而言之,结构主义研究几乎把焦点完全放在了音系和形态的研究上,尽管在这些领域语言之间看来确实不同,不仅范围广,而且形式复杂,这是一个具有更广泛兴趣的问题,我后面还会回到这个问题的讨论上来。
在普通生物学领域,其主要的局面也很相似,这一点可以体现在分子生物学家冈瑟·斯坦特的评论中:有机体的多样性是如此自由,它们构成了“几乎无穷多的必须被一一分类的特定个体”。
如何使统一性和多样性协调起来的问题在生物学和语言学里都常常出现。在十七世纪的科学革命中发展起来的语言研究将普遍语法和特定语法区分开来,尽管这一区分还不完全是当代生物语言学方法意义上的区分。普遍语法被认为是该学科的知识核心,而特定语法则被认为是这个普遍系统中偶然的即时表现。随着人类语言学研究的兴盛,钟摆转向了另一个方向,倾向于多样化的一方,这点在我所援引的鲍阿斯式的理论陈述中有很清楚的表达。在普通生物学里,这一论点于1830年在自然主义者乔治·居维叶和若弗鲁瓦·圣·蒂莱尔之间的一场著名辩论中已经被尖锐地提了出来。居维叶的立场比较盛行,特别是在达尔文进化论提出之后,它强调多样性,得出的结论是几乎存在无数的变体,它们必须被一一归类。大概在生物学领域被引用最多的一句话是达尔文《物种起源》一书中关于确定性的评论,即“从如此简单的一个开端,无穷无尽的最美丽和最奇妙的类型已经和正在进化”。我不知道是不是有意嘲讽,这些话被进化生物学家肖恩·卡洛尔用做了“进化——发育(evolution-development)新科学”的导论标题,该导论旨在揭示已经进化的形式远非无穷无尽,相反地,事实上它们出奇地一致。
最近的一些研究发现倾向于支持达西·汤普森和阿兰·图灵早期关于限制有机物多样性这一原则的一般方法。用图灵的话来说,真正的生物学应该将每个活着的生物组织视作是一种可适用于物理和化学的特殊法则系统,这些法则严格地限制了它们可能的多样性,并确定了它们的基本特性。那种视角在发现了主控基因、深度同源、守恒和很多别的法则之后,今天听起来应该不是那么极端,甚至可以说,进化/发育过程所限制范围是如此狭窄,以至于“对生命蛋白质这个磁带的播放可能是令人惊讶地重复进行的。”我引用的是《科学》杂志上关于适宜性突变途径的一个报告,它重新解读了史蒂文·古尔德的一个著名比喻意象。史蒂文·古尔德认为,生命的磁带,如果可以重播,应该遵循若干多样的路径。生物化学家迈克尔·舍默在其《细胞周期》里争辩道:“大约5亿年前,在寒武纪稍稍往前一点的时候,在单细胞生物或原生多细胞生物里出现了为各种后生动物门类③的主要发育程序提供本质性编码机制的普遍基因组。那个时候,复杂动物形式突然爆炸式出现,很多后生动物的门类,它们都有着相似的基因组,却又存在显著的差异,因为它们使用了发育程序中的特定组合。”按照这种概念,从一种足够抽象的观点来看,即以一个高级科学家的眼光,从一种更高度文明的视角来看地球上的事件,存在一种多细胞的动物。表面的多样性是由于进化中保存下来的“发育遗传工具”(正像人们有时所说的那样)的不同安排导致的。如果这些想法正确,那么统一性和多样性的问题也就可以用一种可能让近来的几代科学家们大为吃惊的方式重新论述。
在达尔文时代,统一性问题也并非没有人注意到。达尔文亲近的同伴和评论者汤玛斯·赫胥黎的自然主义研究,使得他带着几分迷惑地评述道:似乎存在一种“先前所决定的东西”,它使得自然选择为每个物种“产生出无限多的数量和类型”来。这个结论使人回想起早先关于“理性形态”的思想来(歌德关于植物原型形式理论的著名例子),这些部分思想已经在“进化——发育的革命”中复活。
时至今日,在普通生物学和语言学领域里,钟摆都开始朝向了统一性的一方,这为传统思想的理解提供了新方法。
4 语言是交际工具吗?
让我们回到开始时提到的两个基本问题中的第一个问题上来:究竟为什么会有语言?正如我所提到的那样,从生物史上来看,在距离现在很近的某些时期,这个问题仍然没有出现:那时根本没有语言。当然,那时有很多动物交际系统。但它们在结构和功能上都与人类语言存在着根本不同。用马克·郝塞关于交际进化的观点来看,人类语言甚至不符合动物交际系统的标准类型。长期以来,人们约定俗成的看法是认为语言系统的功能是交际。某种程度上说这种特性的总结具有一定意义,但它却似乎是不正确的。语言当然可以被用来交际,就像我们所做的其他任何方面一样,如服饰风格,动作姿态等。它也可以而且通常被用作更多别的功能。从统计学的角度来看,无论如何理解,语言压倒一切的用处是其内在的用处,即用于思想。要想让自己从苏醒时候或睡眠状态下的自我对话中解脱出来需要极大的意志,这一点常常十分令人苦恼。人类语言的核心特征似乎与动物交际系统截然不同,它在很大程度上是生物世界里所独一无二的,不只是在功能方面,而且在所有其他一些方面:语义、句法、形态和音系方面。
5 语言是怎么出现的?
那么,这个奇怪的东西④是怎么出现在生物学记录上的(显然它是在一个非常狭小的历史窗口之下发生的,可能大概在向前推溯五万年到十万年之间)?关于这一点没有确定的答案,但我还是要描绘一个对我来说比较合理的解释图景,这一点与近年来在生物语言学框架下的研究工作密切相关。
解剖学意义上的现代人可以在几十万年前的化石记录中找到,但是关于人类能力的证据则离现在要近得多,不会早于离开非洲大陆的时代。古人类学家伊恩·塔特首指出:有证据表明“可以发出言语声音的发声通道”其存在的时间比我们的祖先真正使用任何形式的语言大约要早50万年。他写道,“我们必须得出这样的结论”,“语言的出现及其解剖学上的关联,不是由于自然选择所驱动的,不管事后想来这种革新可能有多大的益处。”这一结论在标准的进化生物学那里没有任何问题,这与通俗文献里的情形相反。人的大脑达到现在的尺寸好像是在大约10万年前。因此,这使得一些专家如神经科学家乔治·斯特里德认为“人类语言的进化,至少部分地,是大脑的绝对尺寸增大的一个自然适应性结果。”关于语言,塔特首总结道,“在人类的血统中,大脑经过一段很长时间的不规则膨胀和重新组织,某些事情发生了,从而为语言习得提供了舞台。这种革新会依赖于突然浮现的现象,先前已经存在的要素得以借此结合在一起,产生出完全意想不到的新东西来。”可以假定,“在人类血统中的某些人身上发生的、从遗传学的角度看来是很小的那些神经变化,可能与适应性没有任何的关系。”尽管它可能带来优势并因此不断增生。它可能是大脑绝对尺寸变化产生的自然结果,也可能是由大脑中偶然发生的某些小小突变引起的。之后不久(从进化的时间表上来说并不算久),又有了一些可能由文化所驱动的革新,它导致了行为学意义上的现代人类的产生,导致了“人类能力”的定型,也导致了人类离开非洲的艰辛跋涉。
那么那个发生在一些小群体之中的、从遗传学的意义上来看是相当微小的神经改变是什么样的改变呢?为了回答这个问题,我们必须去了解语言的独特特点。我们所共有的语言能力,其最基本的特点是,它使得我们能够构造和理解离散而无限的、层级性的结构表达。说它离散,是因为我们有五个词的句子,有六个词的句子,但是却没有五个半词的句子;说它无限是因为不存在一个无限长的句子。因此,语言以一种递归的生成程序为基础,它从某种储藏库(我们称之为词库)中选取类似于词的基本元素,然后重复地使用它们,造出无限的结构表达来。要解释语言官能的出现并因此解释至少有一种语言的存在,我们必须面对两个任务。一个任务是解释“计算的原子”,即词汇项目,一般在三万到五万之间;第二个任务是发现语言官能的计算特征。这一任务接下来又体现为几个方面:我们必须力求发现思维中建构无限表达的生成程序,以及将这些内在的心智对象与两个接口联系起来的方法,这两个接口所连接的是外在于语言(但是内在于有机体的)的系统,即一方面是思维系统,另一方面是感觉——运动系统,它可以将内在的计算系统和思维系统外化。这是对语言是一种声音和意义相联系的产物这一传统观念的重新阐述,这一观点至少可以追溯到亚里士多德时期。所有这些任务诱发了不少的严肃问题,比我们过去所想的,或现代常常会想到的问题要严肃得多。
在转向上述问题之前,先看一个基于历史事实的观察会很有助益。语言官能为生成无限多的表达提供了手段,这一事实实际上是不言而喻的,但是直到大概50多年前这一事实还没有引起人们足够的注意。原因之一是因为只有在二十世纪中期,递归生成的概念才在逻辑和数学界有了清晰的认识,从而使得“语言是如何利用部分这样程序的”这样重大问题的提出成为可能。然而基础性的考察则可以追溯到早期的科技革命。附带说一句,可以追溯到伽利略,尤其是到笛卡尔,对后者来说这一事实占据着其关于心智和身体理论的核心。笛卡尔认为,人类与动物或机器之间最大差别是所有的人都能够用一种富有创造性的方式自由地表达他们的思想,没有限制,也不依赖于外部事件或内部的状态,其表达方法可能是全新的,然而却能被别人所理解,没有任何动物或机器可以这样做。请注意,笛卡尔已朴素地预设了我提到过的语言机制的组成部分:词库,生成程序,与语言外部诸系统(思维系统和感知——运动系统)的关系;但是他却把注意力重点放在了一个特别的思维要素上:以一种适合于环境的(而不是由环境所导致的,这是一个关键性的不同)方式去使用语言官能诸多机制的无限能力。这种能力并不为语言所特有,而是具有普遍的作用。笛卡尔强调语言的情况,因为这种情况的事实是如此清楚。这些问题再进一步发展就成为一个很有吸引力的话题,这个话题我且按下不表。我把这些都提出来只是为了强调一下即使我们能给出一些关于语言机制基本问题方面的令人满意的答案——这些问题都是科学中的难题,对此我们掌握的还很有限——语言能力的创造性“使用”这个根本问题仍然无从回答。
让我们转向语言的基本要素上来,从生成程序开始,它似乎应该是出现在5至10万年之间的某个时间,在生物进化的时间轴上这也就是一眨眼的功夫,我们假定期间包含一些微小的大脑线路的重组。在这点上,生物学上的进化——发育革命变得与此相关。它为两个相关的结论提供了引人注意的证据。一个结论是遗传天赋是深度守恒的;第二个结论是非常小的一些变化可能造成观察结果的重大差异,尽管由于遗传系统的深度守恒性,由于那些吸引了汤普森和图灵极大兴趣的自然法则的作用,表型的多样性也还是有限的。举一个简单的例子,两种刺鱼,一种在盆腔上带有长而尖的刺,另一种则不带。大约一万年前,一种接近与刺的再生有关的基因的“开关盒”发生了突变,从而区别了两种不同的变体,一种带有刺,而一种没有,一种适应了海洋,一种则适应了湖泊。还有一些更为影响深远的结果则与眼睛的进化有关,这是一个被深入细致研究的话题。结果表明眼睛的类型其实非常少,这部分地是由光的物理特性所施加的制约所导致的,部分地则是因为只要一种类型的蛋白质,视蛋白分子,就可以发挥必要的功能。为视蛋白编码的基因有着非常早的起源,它们被重复地征用,但其方式则非常有限,这同样还是由于物理方面的限制所致。眼球晶状体蛋白质也是一样。眼睛的进化揭示了在一种狭窄的物理渠道所提供的可能性中进行选择时物理法则、随机过程,以及选择作用之间复杂的相互作用。
6 原则和参数系统
这个工作很大一部分源自于弗朗索瓦·雅各布和雅克·莫纳德关于常规回路的研究发现:他们因此获得了1965年的诺贝尔奖。正如雅克布30年前(即在为这些思想提供实质性经验支持的重大发现还没有出现之前)曾指出的那样,生物的表面差异,比如一个苍蝇和一头大象,可能是由激活基因的常规机制在时间先后和安排上存在着一个小小的差异所引起的。雅克布的观点为语言原则和参数这一研究方法的发展提供了可资借鉴的模式,我之后不久的几个演讲中都讨论到了这个方法(参见我写的《规则和表达式》(Rules and Representations))。这种方法以如下的假设为基础:语言由一些固定不变的原则组成,这些原则与一种参数的开关盒联系在一起。而这正是儿童基于当前数据,从有限的语言变体中确定一种语言时所要回答的问题,或者像查理·杨(Charles Yang)所论辩的那样,是要决定一种由参数设置的学习程序所导致的各种语言中的概率分布时所要回答的问题。例如,儿童必须要决定一种语言是像英语一样显现为“中心语在前”,即实词性的成分居于宾语之前的一种语言,如“read the book”,或“in the room”;还是像日语一样“中心语在后”,其相应的部分会说成“book read”和“room in”。和那种常规机制的重新安排的情形相似,这种语言学研究的方法也为理解本质上的统一性是如何导致无限多样性的出现提出了理论框架,而对于语言来说这一无限多样性的出现并不算太久(像一般的生物有机体一样)。
原则和参数的研究方案十分富有成果,它为非常广泛的语言类型范围提供了丰富而新颖的解释,发掘了许多关于语言的、富有意义的、而且是从未曾想过的问题,有时还为之提供了答案。我觉得可以毫不夸张地说,在过去25年里所学到的关于语言的东西比前一千年之内的关于语言的严肃研究所得到的还要多。至于我们在开篇所提到的两大突出问题,这一研究方法认为,那突然出现的是提供原则的生成程序,而语言多样性是由以下事实引发的:原则并不能为所有的语言问题提供答案,而是把一些问题留给了开放的参数。注意,我前面给出的简单例示与排序有关。虽然这点还受到质疑,但我认为有实质性的证据表明排序仅限于内部计算系统向感知——运动系统的外化过程,在核心句法和语义学中它没有任何作用。对此还有很多话要说,但这里暂且将之搁置,而只提及一种关于多样性的意见,这一点后面还会回来讨论。
7 最简方案
除非有明显的反例出现,我们将会采纳这样一种最简单的假设,那就是生成程序是作为一种小的突变结果突然出现的。果如是,我们可以预计生成程序应该是非常简单的。过去的50年里曾探讨了各种各样的生成程序。有一种语言学家和计算机科学家都熟悉的方法是短语结构语法,它是在1950年代发展起来的,此后得到广泛运用。在那个时候,那种方法是有意义的。它与递归程序的数学理论的对等公式的一种(即埃米尔·波斯特(Emil Post)的改写系统)很相恰,它至少捕捉到了语言的某些基本的特点,比如层级结构和嵌入结构。但是,人们很快认识到,短语结构理论不仅对于语言来说是不充分的,而且它还是一种有着很多任意规定的相当复杂的程序。它并不是那种我们希望找到的系统,也不可能是突然出现的。多年之后,语言研究已经找到了削减这些系统复杂性的一些方法,并且最后彻底地删减掉了它们,而选择了一种关于递归生成的尽可能最简的模式:这种操作选取两个已经被构建过的对象(姑且叫它们X和Y),然后将它们组成一个新的对象。这两个成分在这个新的对象里保持不变,于是,很简单,这个集合有X和Y这两个成员。让我们把这种操作叫做“合并”。在具备了词库的概念原子的情况下,“合并”的操作,无限制地反复使用,产生了无限的有层级地建构起来的表达式。如果这些表达式可以被概念系统所解释,那么这个操作就提供了一种内在的思维语言。
有一种非常强式的主张叫“强式最简思想(strong minimalist thesis)”,它认为生成过程是最优化的,语言的原则由有效计算所决定。思维的语言从计算的角度看是完美的。一旦构造的基本模式具备了,并且满足了接口所设定的种种条件,语言就会是像雪花一样的东西,假定其特定的形状由自然法则所决定(在该例⑤中,则由计算有效性的原则决定)。最近一本专业论文集的标题表达了这一思想:“接口+递归=语言?”最大限度上讲,递归可以简化为“合并”。当然,那个问号特别值得欣赏:它反映了时下研究的边缘所出现的重要问题。我以下的讨论将会认为在两个接口之间具有重要的不对称性,与思想和行动部分相联系的“语义”接口占据首要地位。这些外在的条件有多么丰富应该也是一个严肃的研究问题,同时也是一个难题,因为缺乏关于这些思想——行动系统的独立于语言的证据。由Juan Uriagereka和Wolfram Hinzen提出的一种非常强式的主张认为,思想的中心部分,比如命题,基本上是从最优地构建起来的生成程序所派生出来的。如果这种想法可以变得清晰和被认可,那么关于语义——语用在语言设计的接口就会相应地被削减。
虽然强式最简思想还没有完全建立起来,但它比之几年前看起来更为可能。如果这一思想是正确的,那么语言进化的问题将会削减为合并操作的出现、词库概念原子的进化、与概念系统的连接、以及外化的模式等。任何不可削减为合并的语言原则和优化计算的剩余部分将应被某些别的进化程序来解释,关于这种程序,我们是不大可能知道太多的,至少就现在所了解的方法来说是这样。
请注意,在这个理论图景中没有关于语言初期形式(比如说那种只包括短句子的类语言系统)的存在空间。没有任何理论根据可以去假设存这样一个系统。从七个词组成的句子变成离散的无限的人类语言要求的递归程序与从零到无穷大所需要的递归程序相同。当然没有任何直接的证据证明存在这样的“原型语言”。除了语言的出现之外,相似的观点也适用于语言习得,但我将暂且将之搁置不论。
关键是,“合并”操作产生了大家所熟悉的语言“挪位(displacement)”特性,即这样的事实:我们在一个位置为短语发音,却在别的地方也能解释它。因此,在句子“Guess what John is eating”里,我们把“what”理解为“eat”的宾语,就像在“John is eating an apple”一样,即使我们在别的地方发它的音。这种特征似乎往往是悖反的,是一种语言的“不完美性”。它并非捕捉语义事实所必需,却又无处不在。它的能量超越了短语结构语法,因而要求附加装置更加复杂化,但它自然地归属于“合并”。
为了弄清怎么回事,让我们假设“合并”操作已经构建起了与“John is eating what”相对应的心智表达式。一种更大的表达式可以通过两种途径的合并而被建构起来:“内部合并”从表达式内部来添加东西,而“外部合并”则可以增加新的东西,生成“guess what John is eating what”。
这给我们研究移位现象提供了一定的方法。在“what John is eating what”这句话中,“what”出现在两个位置。实际上这两个位置都需要语义解释。在最初位置上的“what”解释为动词“eat”的直接宾语,而出现在新位置,即边界位置的“what”解释为一个其范域大于一个变元的量词,因此整个表达式表示类似于“for which thing x,John is eating the thing x”这样的意思。
这些观察可以概括的构式范围非常广。其结果也正是语义解释所需要的,但是所产生的却不是英语的发音对象。在英语中,人们不说“guess what John is eating what”而是说“guess what John is eating”,原始位置上的“what”受到了抑制。这是挪位的普遍特征,它伴随着一些并不是非常重要(但却有趣)的限制条件,我们这里可以忽略它们。这个特征遵循基本的计算效益原则。要将内部生成的表达“what John is eating what”外化,就需要说两次“what”,但当我们考虑表达式的常规复杂性和“内部合并”产生的“挪位”的实际性质时,就会发现这对计算系统来说是个很可观的负担。除了其中的一个“what”外,其他“what”的出现都受到抑制,计算的负担就大大得到减轻。必须发音的那个出现体是最突出的一个,它是通过“内部合并”创造出的最后一个出现体。否则,运用该操作所产生的正确的语义解释就不能够被表示出来。看来,语言能力在外化过程中使用了计算效率这一普遍原则。
抑制被挪位成分的多个出现体(occurrences)而只保留其中之一,这在计算上是高效的,但却又为交际增加了很大负担。听到这句话的人必须去发现被移位的成分能够得到解释的那个空缺位置。总体来说这是一个非常重要的问题,是句法分析程序中人们熟知的问题。这样,在计算的有效性和解释——交际的有效性之间就会存在一种冲突。普遍认为,语言会通过保持计算的有效性来解决这个问题。这些事实表明,语言作为内部思想的工具得以进化,外在化则是次要过程。在产生相似结论的语言设计中能够找到大量的证据,比如说“孤岛特征”。
还有一些独立的理由使得我们可以得出关于外在化是次要过程的结论。其中之一是外在化似乎是独立于模态的,如同近年来通过对手势语的研究所认识到的那样。手势语和口语的结构特征极为相似。语言习得遵循相同的进程,神经定位也很相似。这一趋向更加证明了语言对于思维系统是最优的,而外在化则是次要的这一结论。
更概括点来说,“无限合并”作为语言的核心原则,一定源自于某个个体而非集体的大脑中某种神经线路的重组。如此拥有天赋的这个个体可能具有许多的优势:复杂思维的能力、计划的能力和解释的能力等等。这种能力会部分地传给后代,并且由于他具有选择性的优势,而可能在一个小的种群中占据统治位置。⑥在那种情况下,才有可能具有外化的优势;因此,作为一种次要的程序,这种能力与感知——运动系统连接起来,实现包括交际这一个特例在内的外化和互动。很难想象,如果连这点起码的假设都做不到——不管采取这样或那样的形式,还能怎么来解释人类的进化。任何更多的假设都需要事实证据和基本原理,那就更非易事了。
8 生物进化和历史改变
一些杰出的进化生物学家也发表了相关的看法。在1974年举办的生物语言学国际会议上,诺贝尔奖获得者萨尔瓦多·利亚的观点最为强劲有力,他极力主张:鉴于语言与“抽象思维和能产性思维发展”之间的重要关系,交际的需要不可能为“创造语言这样的系统”提供“任何强大的选择压力”。弗兰克斯·雅各布也持有同样的观点,他认为“语言作为个体之间的交际系统的职能只能是第二位的,使得语言独一无二的品质并不在于其交流行动指令的作用”,也不在于动物之间所共有的一些别的交际特征,而在于其符号化的作用,在于其激发认知形象的作用,在于其为我们关于现实的观念塑型的能力,在于其产生思维和计划的能力,这些能力因其允许“符号无限组合”和随之而产生的“可能世界的心智创造”这一独一无二的特性而成为可能。这些观点可以追溯到十七世纪的认知革命,这场认知革命从很多方面预示了二十世纪五十年代以来的发展。
而我们也不仅仅是推测。对语言设计的研究可以提供有关语言和感知——运动系统及思想系统之间关系的证据。如前所述,我认为有大量证据支持这样一个自然结论:即这种关系是不对称的⑦,其方式就像在位移的关键性例子中显示的那样。
外化不是一项简单的任务,它必须连接两个明显不同的系统,一个是似乎成千上万年以来一直保持基本完整的感知——运动系统,第二个则是新产生的用于思想的计算系统,它是完美的——如果强式最简思想是正确的话。那么我们期望,形态和音系,这两种把内部语法目标转化成可进入感知——运动系统的实体语言过程,可能会是非常复杂和多样的,且受偶然历史事件的影响。那么,多数的甚至全部的参数化和多样性都将仅限于外化部分。那基本上正是我们似已发现的内容:有效地生成各种提供思想的语言表达式的计算系统,和很容易受到历史变化影响的、高度多样和复杂的外化模式。
如果这个图景大致准确的话,我们可能就找到了两个基本问题中的第二个问题的答案了:为什么有如此之多的语言?原因可能是:在最初的人口以不同的方式分散之前或之后,外化的问题就以许多不同的和各自独立的方式得到了解决。
我们没有理由去假设解决外化问题牵涉到进化的改变,就是说涉及到一种基因组的改变。它可能只是现存的认知过程以不同方式在不同的时期所导致的一个问题。不幸的是,有时会有一种混淆真正的进化(基因组的)改变和历史改变这两种完全不同现象的倾向。就像前面提到的那样,有很强的证据证明自从大约五万年前的非洲大迁徙以来并未发生过语言能力的任何相关进化,尽管无疑一直有大量改变,甚至还会有外化模式的创新(例如手势语)。对这些问题的混淆,可以用替换措辞概念来得到解决,“语言的进化”和“语言改变”可以用更精确地对应词来替换,即使用语言的有机体的进化,和他们使用语言的方式。使用这些更准确的术语来看的话,语言能力的出现涉及到进化,而历史改变(这是时刻发生的)则没有。
重申一下,这些看起来是最简单的假设,没有任何已知的原因来拒绝它们。如果这些观点基本上正确的话,那么接下来的结论就是外化的部分可能根本就没有进化,相反,它很有可能一直是一种使用现存认知能力解决问题的过程。那么生物学意义上的进化将被限制在提供“合并”这种操作的突变上,以及任何强式最简思想所不能解释的其余部分上。相应地,任何将重点放置在交际或感知——运动系统,或者口语的统计特征,抑或其他类似方面的关于“语言进化”的方法,都将是一种严重的误导。这个判断涉及面非常广,正像那些熟悉文献的人都会明白的那样。
9 结语
回到开头提到的那两个突出的问题上来,对它们的解答我们至少有了一些建议:我觉得这些建议是有道理的。即关于一种语言究竟是怎么产生的和关于为什么语言似乎会有如此广泛差异的问题。第二个问题部分地是一种错觉。它在很大程度上像有机体明显的无限多样性一样,这些多样性都是基于深藏未变的元素,其现象性的结果是由自然法则(对于语言来说,就是计算的有效性)所限制的。
还有一些要素可能强烈影响语言设计,其中值得注意的是大脑的特性,这一点现在还不清楚。甚至对于我们这里已经讨论的话题,也还有着许许多多的话要说。但让我们先不要追究这些问题,而把我们的注意力转向词汇项目这些思想的概念原子及其最终的多种方式的外化上来。
概念结构在其他的灵长类动物那里也可以找到:可能的概念结构有动作者——行动——目标的图式、范畴化、还可能有单复数的区别,以及别的一些东西。这些又被语言所征用。但是,词汇项目/概念却似乎是人类所独有的。
关键的问题是,在人类语言和思想中甚至是最简单的词语和概念都缺乏一种与独立于思维的动物交际实体之间的关系。后者被认为是以思维/大脑的程序和“一种使得动物行为与这些程序相适应的环境因素”之间存在的一一对应关系为基础:这是认知神经科学家兰迪·加里斯泰尔在为一本关于动物交际的重要论文集做导论时所说的话。珍妮·古多尔在自然生存环境下对黑猩猩做过近距离考察后报道,对于它们来说,“要在不出现适当的情感状态的情况下发出一个声音好象几乎是不可能的事情”。
人类语言和思想的符号则截然不同。它们的使用并不与情感状态机械地一致,也不会从世界里把那些独立于思维的客体或事件单列出来。对于人类的语言和思想来说,似乎并不存在弗雷格、皮尔士、塔斯基、奎因以及语言和思维的当代哲学意义上的“指称”关系。我们所理解的一条河、一个人、一棵树、水等等,结果都一致地被证明是十七世纪的研究者们所称的人类“辨别力”的一种创造物,这种“辨别力”为我们从内部视角提及外部世界提供了丰富的工具。像大卫·休谟在总结一个世纪的研究成果时所说的那样,由辨别力所建构起来的对象不能简单化为“属于”我们所谈论的“一个特定类别”。从这个意义上看,内在的概念符号就像是心智表达式的一个诸如音节[ba]这样的语音单位。每个将这些心智对象外化的动作都会产生一个独立于思维的存在体,但是想要去寻找一个与这个音节对应的、独立于思维的构造体则是白白浪费时间。交际并不是一件这样的事情:制造一个听话人可以从世界上挑拣起来的(像物理学家可以做的那样)、外在于思维的实体。交际或多或少是一种事务,这在个事务中,说话人造出一个外在的事件,听话人则尽最大可能拿它与自己内在资源相匹配。词语和概念在这个意义上是相似的,即使是在最简单的情形也是一样。交际依赖于共有的辨别力,在共有的构造体、共同的背景、共同感兴趣的事情、共同的预设等范围之内达到目标,并允许获得(或多或少)共同的视角。词汇项目的这些特性似乎是独属于人类的语言和思想的,并且必须在对他们的进化研究中得到解释。至于如何做,还没有人有什么明确看法。几乎没有人认识到甚至还有问题,这是被指称主义的教条所吸引的结果。
人类的辨别力为我们提供了一个经验的世界,它与其他动物的经验世界不同。作为思考的生物(多亏人类能力的出现),人类努力使得经验具有某种意义。这些努力被称作是神话、宗教、魔法、哲学、或用现代英语的说法:科学。对于科学来说,指称的概念在技术意义上是一种标准的理想:我们希望被创造的概念能够弄清世界上某些真正的东西,如“光量子”或“动词短语”。指称的概念在现代逻辑的背景下是挺好的。在这些现代逻辑形式系统里,像数字和其所代表的数之间所存在的“指称”关系是被规定好的。但人类的语言和思维似乎并不是那样工作的,由于没有意识到这一事实,结果导致了没完没了的混乱情况。
至此,我们触及到了极为有趣的大课题,但我暂且将之搁置一旁。请允许我只对目前关于语言和思想的统一性和多样性的最好的猜想做一简要概述。我们的祖先以某种完全不为人知的方式发展了人类概念。在距离现在非常近的某个时间,可能大约是在七万五千年前,在非洲东部一小群原始人中的某个个体经受了决定“合并”操作的基因突变——这种操作把人的概念作为计算原子,进而产生了可以为思想提供丰富语言的结构表达。这些过程从计算的角度看可能是完美的,或者近乎完美,因此是独立于人的物理法则作用的结果。这种革新具有明显的长处,于是便在这一小群人中散布开来。在之后的某个阶段,思想的内语言与感觉——运动系统联系了起来,就能在不同时期以不同方式完成一个更加复杂的任务,而这个任务很可能与进化过程毫无关系。在这些事件发生的过程中,人类的能力也随之成形,随之产生了华莱士所言的“人类道德和智力的本质”的相当大的一部分。这些结果看起来高度多样化,但却有着本质的同一性,这反映了人类在其根本方面所具有的一致性。正如我们早先假想的那个地球外的科学家的例子一样,他可能得出这样的结论:只存在一种语言,它可能有些次级的方言变体,但这些变异可能主要地,也许是全部地,是以外在化的形式实现的。
作为结语,我想重申的是,即使这第二位的一般性假设结果被证明或多或少有些道理,仍然有相当大的空白需要去填补,也还有不少几百年来悬而未决的问题留待解决,其中包括诸如“被称之为心智的”特征是怎样与“大脑有机体的结构”相关联的问题,这是18世纪的理论论述(formuation),以及关于语言创造性和连贯性日常使用的更为神秘的问题等等,这是笛卡尔科学所关注的核心问题,这些在研究中都还仍然未能触及。
*《如何看待今天的生物语言学方案》中文文本经乔姆斯基授权在《语言科学》发表,英文文本是乔姆斯基为国际中国语言学学会第16届学术年会(IACL-16)(北京大学)撰写的大会演讲稿。——《语言科学》编辑部
**译者遵黄正德教授、沈阳教授之嘱,在会前将演讲稿译成中文文本,译稿蒙黄正德教授、郑礼珊教授和沈阳教授审校,在此谨致谢忱!译文如有舛误概由译者本人所致,文责自负。——译者
注释:
①译者注:原演讲稿没有节标题,本译文中的节标题是译者根据原文内容为读者理解方便而添加的。
②译者注:这里的具体日期指本段开头提到的“这两个问题的答案的确定”的具体日期,即语言出现和进化的具体日期。
③译者注:“门”是一种古代生物的类别。
④译者注:“这个奇怪的东西”这里指的是语言官能。
⑤译者注:“该例(in this case)”指的是语言的情形。意思是说,正像雪花的特定形状是由自然法则决定的一样,语言的特定的形式则是由计算的有效性原则所决定的。
⑥译者注:作者这里意在于指出,语言是为思维而产生的,而交际等外化的能力只是人的用于思考的内在语言能力的一个副产品,因此相对于思考的程序而言,语言交际等外化的程序是次要的,而思考的程序才是主要的。
⑦译者注:这里的“这种关系”指的是语言和感觉——运动系统的关系及语言和思想系统之间的关系,作者认为这两种关系是不对称的。