进化语言学的演变_语言学论文

演化语言学的演化，本文主要内容关键词为：语言学论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

演化语言学其实就是语言学，是以演化论为基础的语言学。自从达尔文（Charles Darwin,1809－1882）1859年的书出版后，这150年间生命科学有多次革命性的进展。人的DNA这本天书我们已经开始阅读了。演化论里有许多思想、许多方法，都非常值得我们借鉴。当然影响不会都是单方向的。演化论这100多年的进展是建立在生物界里。而语言的演化却是双重的——它是一种生物功能，也是一种社交行为。我相信研究这样双重的演化，一定会替演化论提出新的刺激、挑战，产生一些对演化理论的新看法。

1.缘起

语言是一种由两股演化力量塑造的行为，一是生物的，二是社会的。虽然人类语言可能几十万年前就涌现了，系统性地研究它的演化却是随着演化论的发展才开始，而演化论始于达尔文及孟德尔（Mendel）的辉煌作品，后继又有诸多学科的重大发现，尤其是人类学、生物学和心理学，这些研究都受惠于最近在统计学与计算机科学上所发展出来的强大方法。

近几年来，语言演化的研究因为一系列成功的国际跨学科研讨会而变得更有架构，这些会议名为EVOLANG，每两年一次。第一届于1996年在爱丁堡举行，最近一次（EVOLANG-8）刚在乌特勒支（Utrecht）闭幕。下一届会议EVOLANG-9预计于2012年在京都召开。

《科学》（Science）杂志为EVOLANG一8专门采写了报道（Balter 2010），文章着眼于演化语言学里一个有趣的问题：人类早期的语言比较依靠手势，还是靠发声？当然，没有人会否认，眼睛和耳朵这两种沟通模式都很重要。此外，近来关于灵长类和鸟类沟通的实验，都增进了我们对上述问题的认识。人类的语言也是生物界的一种沟通方式，研究其他动物的沟通一定能对了解语言的本质有所启发。

语言演化随着不同的规模进行。若干年前思索此一问题时，我曾提过三个尺度：宏观史（macrohistory）、中观史（mesohistory）与微观史（microhistory）（Wang 1978）。当研究人员探索黑猩猩的手势和鸟的歌声如何关乎语言涌现时，就如Balter（2010）的文章所探讨的，他们从事的是宏观史的研究——人类如何从“没有语言”过渡到“有语言”。这个领域所获得的答案，会为语言学界提供人类早期产生语言的条件，相当于宇宙论里的“大爆炸”（big bang）理论。

探索语言如何随着世纪更替，受到纵向或横向传递的影响而改变的这种研究，可称作是中观史的研究。这是传统历史语言学和类型语言学的研究范畴，主要基于比较法和构拟法。由于汉语语言学涉及的文本年代悠久，而且触及众多语言和方言，因此它所能做的贡献必定相当可观。微观史研究所探讨的，是我们直接能取得一手资料的课题，因为语料来自活生生的说话者，也许是早期牙牙学语的婴儿，或是口音浓重的外语学习者，甚至是不同社群、不同年龄层的人所显现的正在进行中的音变。沈钟伟（1997）用先进的统计法分析不同年龄的人怎样说上海话来研究音变，就是一个很好的例子，他的研究最近得到计算机科学家Niyogi（2006）的肯定。

我们势必会期待，这三个尺度彼此关系紧密。例如，现场说话者所提供的直接语料，让我们有难得的机会一窥过往。语音学家一直在努力研究声带的动态构造，以便从发声的程序来解释，为何有些音变会在世界各地一再复发。目前，脑成像的工具已经越来越唾手可得，希望我们很快就能更深一层理解语言基本的心理程序，包括它所涉及的记忆和演算能力。具备了这样实证基础的生物现实，就能把语言学往前推进一大步，避免几十年来困扰着语言学界的那些无谓的句法分析争议，尽早跳出走火入魔的研究方式。无论如何，我们应该深思这三个尺度如何彼此息息相关，最后才能将它们集大成，对人类语言的发展提出连贯一致的合理解释。

2.语言学的萌芽

我撰写此文意在从汉语的角度出发，粗略描绘出演化语言学历史发展的主要脉络。演化语言学的萌芽可远溯及古代哲人。希腊的柏拉图（Plato，约公元前428一-348年）和中国的荀子（约公元前312—230年），都意识到词汇的音与义之间的人为联系，全靠规约惯例（conventionalization）才能搭在一起（Wang 1989; Yu 2009）。荀子说这叫“约定俗成”。中国宋朝时有位学者已经为文论述实词与虚词的重要的差异。

字之指归又有虚实，虚字则但当论字义，实字则当论所指之实。（陆九渊《与朱元晦书》）之后，元朝的学者也发表了高见，虚词都是由实词经历虚化（grammaticalization）的过程演变而来（郑奠、麦梅翘1972；Sun 1996）。

今之虚字皆古之实字。（周伯琦《六书证伪》）可惜，这些早期的真知灼见并未能形成一股研究风气，中国的语法研究一直到20世纪才开始有系统地开展。

语音的系统性研究，特别是研究《诗经》里押韵的字，始于明末的陈第（1541－1617），他以下面这段著名的话，提出字无时无刻无处不在演变：

盖时有古今，地有南北，字有更革，音有转移，亦势所必至。（《毛诗古音考·序》）

与语法研究的命运完全相反，陈第的创见到了清朝，在杰出的文字学家手中，的确发展为一股研究风潮，这些学者为我们奠定了基础，让今人得以了解汉语三千年来的语音变迁。汉语的传统虽比william Jones（1746－1794）的印欧语研究起头要早，却总受限于研究焦点的狭隘，只着眼于一种语言，而西方语言学比起来研究范畴广得多，尤其是受人类学影响，注重田野调查，探索了许多从未发展出文字的语言。

Jones之后的一世纪可谓印欧语研究的极盛时期，语言学家发现了语言间的亲属关系，也从事了历史构拟，这些研究主要受惠于比较法。这种方法可以运用在许多学科上，特别是解剖学和动物学。其基本创见在于，借由比较现代生物之间相互对应的特征，我们得以推论这些生物远古祖先的模样，并推知从祖先到现在的后代子孙之间历经了哪些过程。

3.语言传递：纵向和横向的

语言当然不是生物，但这两个研究的领域却共有一些相同的演化特色，因此说它们相似一点不假。最明显的例子是谱系树，生物学和语言学都经常利用此法，来表现特征的纵向传递。但从另一方面而言，两个研究领域最大的不同在于，语言特征时常也靠横向方式传递。

August Schleicher（1821－1868）也许是第一位用树形图来表示印欧语言间的关系的语言学家（见图1），他还可能是第一个说明树图上的分支也许可以用来代表消逝的时间的理论家，因此两种语言在时间上分歧的程度，可以简单、量化地从连接这两个语言的最少分支的总长来决定。他的看法里所隐含的，即是生物学家称之为“分子时钟”（molecular clock）的概念，该概念假设在演化的时程里，变迁的速率大体一致。不过他可能没意识到，要计算这些分支的长度，其实相当费力。要再等一世纪，当统计理论与计算机科学融合成一门新兴的数值分类学（numerical taxonomy）后，计算法才随之发展出来（Cavalli-Sforza and Piazza 1975）。

图1 Schleicher的印欧语系谱系树形图

达尔文在他划时代的《论物种起源》一书中提到，人类人口的谱系树图应该与人类语言的谱系图相吻合，不过他的论点未免太斩钉截铁了些。与他同时代的赫胥黎（Thomas Huxley，1825－1895）的意见就比较经过深思熟虑，他把达尔文的言论缓和了点，考虑到许多情况下，一群人口原来的语言也可能被其他语言所取代。赫胥黎暗指的是，树图虽能描绘纵向传递，但语言相互接触时，大规模的横向传递也在所难免。

我觉得很明显的是，语言的统一性或许能提供某种假设，支持这样一种说法，即不同民族如果在语言上有统一性，那么在人种上也趋于一致，但是此论并不能拿来证实这种人种统一性，即使目前还找不到反例，除非语文学家们准备证明，任何民族在丧失了自己的语言并采用异族的语言之后，都会随着语言的改变而产生相应的血统改变。（Huxley 1865:257－77）

Cavalli-Sforza等曾画过一张有名的世界人口图，显示根据基因所绘的树图与根据语言所绘的图有何异同（见图2，1988:6002-6）。

图2 世界人口基因与语言谱系对照图

语言彼此接触时，的确可能产生全面取代的现象，这在中国历史上屡见不鲜。两千多年下来，少数民族大都采用了多数汉人的语言。最佳的一例是满族人被同化而融入汉人主流文化，满人虽曾统治中国将近三百年之久，至今中国境内能操满语的人却已寥寥无几。不过，如果语言采用的情况不是全面的而是部分的，那么情况便更复杂。现在我们知道，“纯的”语言不可能存在；所有语言都拜接触之赐而或多或少是“混合”语。有的接触在史书里有详尽记载，如英国诺曼征服（Norman Conquest）后法语对英语的影响，或是比征服者威廉（William the Conqueror）早了好几个世纪的汉语对日语的影响。影响通常是双向的，不过通常并不对称。

如果是因为征服和殖民主义而导致长期深入的接触，语言的影响也会因此广泛的多。这时候被采用的东西就不只是词汇了，还包括语言的其他要素，如音韵、构词和句法。比如，英语中有许多词的词根来自日耳曼语系，但前后的词缀却来自法语。汉语方言近来的研究非常丰富，连金发对闽南语里双向扩散的探讨特别有启发，光是单一一个音节，其声母、韵母、声调等层次却可溯及不同的历史深度（Wang and Lien 1993:345－400; Lien 1993:255－76）；汪锋（Wang 2006）对云南白语和西南官话互动的层次分析，点出了语言分类的基础议题；阿错（Atshogs 2005:1－33）对青藏高原上结合了汉语和藏语的倒话所作的诠释，从类型学观点来看尤其有趣。

李敬忠（1994）分析了壮语对粤语的广泛影响，提醒我们南部方言里诸多词汇来自少数民族。粤方言里，香港话明显地受到英国150年殖民的影响。句子间的语码转换（code switching），甚至是句子内的语码混合（code mixing），都已司空见惯。混合的形式基本上保留了汉语的语法结构，却插入了英语的词汇。最近笔者听到的两个例子是：

（1）Gua-m-guarantee-ga?

英语的guarantee（保证）一词被拆开了，以融入汉语的“A－不－A”疑问句型。句尾的ga是两个句末助词“嘅”（ge）和“呀”（a）合并而来，如果用普通话来说，这个问句应该是“保不保证的啊？”要注意的是，普通话否定词“不”之前只保留了动词“保证”的第一个音节，就像粤语里否定词“唔”（m）之前只保留了guarantee的第一个音节（Wang 1967:224－36）。

（2）So-mat.je-rry-a?

这里英语的sorry（抱歉）被拆开，以融入汉语“X－什么－Y－啊”的句型。此混合形式意思相当于“你为什么抱歉啊？”英语的Sorry,Bye-bye，和OK几乎已经是举世通用的三个词了。用普通话来说便是“道什么歉啊？”其中“道歉”是动词，“什么”则相当于粤语的mat.je，通常写作“乜嘢”，有时也可以合并成me，写作“咩”（Cheung and Bauer 2002）。

这些显然都是语言接触所造成的横向传递之实例。生物学里的传递主要是纵向的，透过基因由父母传给子女，但语言还靠横向来传递特征。Schleicher的学生Johannes Schmidt（1843－1901）就注意到这种双模式的传递，他于是提出了互补的“波浪”理论（wave theory），强调空间因素对语言变迁的影响，及由此导致的语言关系。临近的人口因为接触较频繁，因此语言混杂的情况也会更多。Cavalli-Sforza和我曾运用人口遗传学的方法，也就是所谓的“踏脚石”模式（Stepping-stone model），来研究密克罗尼西亚一串岛链的词汇，从这些岛屿的空间分布距离和词汇替代的速度，我们取得了相当忠实的对比关系（Cavalli-Sforza and Wang 1986:38－55）。

因此，演化语言学所要解决的中心课题是，如何把纵向传递（遗传而来）的特征，与横向传递（借用而来）的特征区别开来。靠着或然率的推理，并奠基于数值分类学的方法，这方面的研究近几年来已经有了些许进展（Minett and Wang 2003:289－330; Wang and Minett 2005:121－46）。但如果我们要了解语言真实的史前史，知道这两类传递力量的互动如何塑造语言，那么我们还有许多工作要做。

4.人类语言的起源

早在Jones对语言的关系提出假设并展开系统的印欧语研究之前，语言起源的问题就已经浮现了。欧洲浪漫主义的两位杰出思想家卢梭（Jean-Jacques Rousseau,1712－1778）及Johann Gottfried Herder（1744－1803）都曾对此问题表态过（转引自Moran and Code 1966）。有趣的是，卢梭的文章是这么起头的：

言语让人类从动物中区别出来……

而Herder的文章却表达了相反的前提：

当人类仍为动物时，就已经具备语言了。

显然，两人的言论之所以大相径庭，是因为从动物沟通这个大视野来看，“语言”或“言语”两个字眼的定义不明。欠缺如此共识就高谈阔论，不啻浪费时间，于是1866年成立的巴黎语言学会章程的第二条款明文规定禁止相关的论述：本学会绝不容许任何有关语言起源抑或创立全球共通语言的言论。

又过了几个世纪后，更多关于其他物种的系统性知识逐步累积起来，Hockett（1960:88－96）也首度提出了一套“结构设计特点”（design features），用来区别各种形式的沟通，到此我们才算掌握了语言之所以为语言的必备知识（见图3）。这个最初的动力，也促成了一系列后续的跨学科会议，其中最负盛名的是1975年由纽约科学院赞助的那场会议（Harnad,et al.1976），还有由James Hurford在爱丁堡发起的演化语言研讨会（EVOIANG）系列。曾经一度被禁的话题，现在却成了许多跨学科整合研究的焦点。关于这些发展的简短评述可参考Wang（2008:279－94）。

图3 Hockett提出的语言的13种结构设计特点

注：1.声耳渠道；2.四散传播与定向接收；3.迅速消失；4.互换性；5.整体反馈；6.专门化；7.语义性；8.任意性（例：鲸、微生物）；9.分离性（例：pin与bin）；10.移位性（例：恺撒的阴影）；11.能产性（例：她有紫色头发！）；12.传统的传播（例：—那是什么？—那是冰屋。）；13.模式二重性。

关于语言究竟为何物，亦即一个系统必须具备哪些必要和充分条件，才称得上是语言，目前仍是众说纷纭。近几十年来，语言学的研究一直着眼于语言的普遍原则，但这些原则很多都受到质疑（Evans and Levinson 2009:429－48）。最有争议的一个问题在于，是否所有语言都具备嵌入（embedding）这样的句法机制。巴西境内的希卡利亚纳语（Hixkaryana）和皮拉罕语（Pirah）据说是不使用嵌入结构的两种语言，其中皮拉罕语更是各家争论的中心所在（Everett 2005:621－46）。

Pullum和Scholtz（2010:111－38）则是从更大范围的语言递归性（recursion）和无限性（infinitude）清晰地讨论嵌入的观念。我们必须谨记，目前拥有的语料已经遍及世界上6000多种语言，即使这些资料弥足珍贵，但所能代表的，却只是人类曾经使用过的所有语言中的极小部分——正如我们目前在地球上所能观察到的物种，其实只占了所有曾经存活于地球上的生物的极小部分。要能更实事求是地回答语言究竟是什么这个问题，必得借助于脑神经认知的研究，而这方面的研究才处于起步阶段。

演化语言学中有两条发展路径是彼此交错的，一是跟我们这个物种有关的群体演化（phylogenetic），二是跟个人一生的发展有关的个体演化（ontogenetic），两者皆是20世纪初新兴的研究。近年来，这两条路径的结合被巧妙的称作Evo-Devo，也就是Evolution-Development（演化－发展），亦即phylogenetic-ontogenetic。这个领域在近几十年来尤其有突飞猛进的发展，而这都得力于认知神经科学，也就是对大脑的认识的突破。

5.语言的个体演化和大脑

为了对两种演化研究和认知神经科学有一个初步认识，下列有关这三类发展的年代也许对我们有些许帮助。

群体演化方面，1973年，荷兰生物学家Nikolass Tinbergen与奥地利生物学家Konrad Lorenz和Karl von Frisch共同荣获诺贝尔生理医学奖。该奖项让动物行为（ethology）这一门新科学的成就广为人知。科学家发现了年幼的动物具备不同形式的印记作用（imprinting），也解读了蜜蜂的舞蹈是一种沟通模式，这些都是语言演化研究上重要的里程碑。

对语言个体演化的兴趣由来已久，从希罗多德（Herodotus）在《历史》一书中所记载、由早期埃及法老王所作的语言剥夺实验，到细心写日志记录自己孩子语言发展的达尔文都是例证。许多大篇幅论述语言的论文，都视语言习得为语言演化的关键要素，但不是所有这些研究都把语言习得问题放在更大的认知框架下来谈。值得注意的一个例外是Tomasello（托玛塞罗2010［2008］）的作品，他把人类幼儿和非人类的猩猩一起比较，借此研究语言习得。

随着Brian MacWhinney在1984年首创的CHILDES语料库，语言习得已愈发茁壮成为一个完善、有效的研究领域，这个语料库全名为儿童语料交流系统（Child Language Data Exchange System）。该领域因结合了计算机科技的进展而有了一个大跃进，从早期简陋的以纸笔记录，发展到现在互联网络上多媒体的资源共享。就这一点来说，CHILDES可谓是引领着语言学领域从事科学研究①。例如，叶彩燕和Stephen Matthews最近出版的双语儿童研究一书（Yip and Matthews 2007），就大量运用了CHILDES的语料进行分析，并且该书还荣获美国语言学会的Leonard Bloomfield图书奖。

第三个领域——脑神经科学的研究，深刻冲击着我们对语言的认识，这方面的研究已经产生了不少诺贝尔奖，最早是巴甫洛夫（Pavlov）1904年对于制约（conditioning）以及Cajal1906年在神经元理论方面的经典贡献，接着是最近所发现的记忆如何在海马回（hippocam－pus）成形（Kandel，2000年获奖），后来还有磁共振成像（MRI,magnetic resonance imaging）的生理基础（Lauterbur和Mansfield,2003年获奖）。值得注意的还包括布什总统的宣言，把1990－1999这十年命名为“大脑的十年”。后续还有一些科学家所办的会议，名为“心智的十年”（Decade of the Mind,DOM）．

虽然人类的身体也要先经历不少变化，才有利于使用语言，但人的大脑才是促使语言无所不能的最大功臣。这些变化包括：更能控制呼吸系统，以供应稳定的气流来支持发声；咽喉位置下降，让所发出的语音之间差异更大；还有脑神经回路的多种调整，以便学习新事物。要想充分了解这些身体上的改变，光是发明语言“器官”、语言“本能”或语言“生物程式”这样简单的名词于事无补，因为这样反而暗示着语言在演化上主要是不连续的。比较正确的看法是1965年诺贝尔奖得主Jacob所用的比喻，他把演化比作一个东修西补的工匠：

……通常他自己也不知道要做出个什么东西来……只是用身边现成的东西，旧纸板也好，绳子也好，木头金属碎片也好，有什么就用什么，拼拼凑凑地做成能用的物件（1977:1161－6）。

他所描绘的景象也恰恰是笔者在Wang（1982）一文中所想的，之后也另外发表过（王士元2006，2008）。我当时用的比喻是“马赛克镶嵌”（mosaic）这个概念，跟Jacob所描写的演化过程意象一致，都是强调在不同时间用不同方法把各种成分拼凑起来，以便支援新的认知功能，亦即语言。Wexler也特别谈到大脑，且用下列的话具体说明脑的神经回路如何运作。

……人类大脑所具备的这些特殊功能，是由于脑内的基本成分数量增多了，不过这些成分在更低等的哺乳动物大脑里早已存在；另外也是由于这些成分之间的联结性越来越强，而其组织结构亦随之改变。（Wexler 2006:32，另见Anderson 2010）

人类婴儿在动物界是独一无二的，他们刚出生时，大脑的重量只有未来发育完全后的四分之一左右——但这个约300克重的脑，在发育前两年内就会爆增到约1000克，最后成年时大脑平均重约1400克。大脑长出新的神经细胞、形成新的联结、并在神经细胞外包覆上一层髓磷脂（myelin）以增进良好沟通的过程，称为大脑可塑性（neuroplasticity）。其实许多神经回路都可以挪去做其他用途。例如一般正常情况下为了听觉而发展的回路，也可以经由实验操控而改用于负责视觉。如果婴儿的大脑里，正常情况下应负责语言功能的左脑回路被剥夺了原本的作用，那么右脑里相应的区域还是能接管这些功能。套用Penfield（1965:787－98）的话来说就是，年轻人的大脑，有很长一段时间都处于“没有确定用途”（uncommitted）的状态。

儿童从早年的全然无助，经过倍受呵护的童年阶段，一直到青春期开始性成熟之前，这段时期的大脑如饥似渴地大量吸收周遭物理环境、社会环境的各类信息。这与其他生物是截然不同的，就算是人类以外的灵长类动物也不会如此，它们多半是刚来到这个世间没多久就得靠自己独立生活了。大家都公认喂哺母乳有许多生化上的好处，但是幼子长时间的吸吮动作，以及和母亲亲密的肌肤接触，也都是儿童将来能健康进入社会化过程的关键。儿童若被剥夺了这样的经验，可能导致心理病态，Harlow在20世纪中所作的猴子与“铁丝妈妈”（wire mothers）实验就清楚地说明了这一点（1971:1534－8）。

演化上，大脑可以分成三个基本成分，大致对应于群体演化的三个主要阶段，但是后来的成分发展都要构筑于先前已有的基础上（MacLean 1990; Lieberman 2000）。首先是我们与所有脊椎动物（包括爬虫类）所共有、作为大脑基础的神经回路。其次是只有我们跟其他哺乳动物所共有的脑皮层结构，包括大脑的边缘系统（limbic system），该系统由神经语言学的创始人布洛卡（Paul Broca）所命名，包括处理情绪的杏仁体（amygdala）、储存记忆的海马回、还有丘脑（thalamus）。新皮层和身体其他部位之间总有无数的感觉运动信号穿梭，丘脑正可以当作这些信号的中继站。

人类的脑皮层最特别的地方，在于它体积的大量增长，尤其是在顶叶（parietal lobe）和额叶（frontal lobe）两部分。增长主要是由于新神经细胞的数目增加，新皮层的表面积也随着扩充（Schoenemann 2005:47－94,Schoenemann 2009:162－86）。那一大片长出的新皮层会在头颅内不断地折叠，因此就造成许多深沟，于是它起皱的外表就成了我们大脑最显著的标记。人类大脑新皮层的表面积区域，比起其他类人猿相应的部分大了有三到九倍之多。前额的皮层，大约是额叶的前半部，特别是主控一切的部位，称为前额叶皮层（prefrontal cortex），心理学家把这个区域所从事的工作称为“执行功能”（executive functions），这大致是决定个人性格的地方。大脑这个区块也是发育时期最久的部位，如Wexler所说：

神经生物学研究表明，人类的额叶一直到20至25岁还会持续积极地发育，一般认为，大脑的这个区域与价值观、道德观、情绪和其他人格特质密切相关（Wexler 2006:242）。

6.模仿、统计学习与记忆

从约300克大小开始增长的婴儿大脑，是个万能的学习机器，配备有各式各样的各领域通用技能（domain general skills,Lenneberg 1967）（见图4）。我们可以证实，学习的历程在呱呱坠地几个钟头后就展开了，早在1977年就有篇文章报道，出生几个小时的婴儿已经会试着模仿别人的脸部表情，虽然他们根本不了解这些模仿有何功效（Meltzoff and Moore 1977:75－8）。Meltzoff与同事又进一步朝这方面研究，探讨婴儿是否会追随实验者的目光方向（Meltzoff and Brooks 2009:169－94）。即使实验者闭上眼睛，但他的脸面向哪一边，九个月大的婴儿也会跟着转头朝那边看。不过，从十个月大起，婴儿只会在实验者睁开眼睛时才跟着转头，这表示他们已经能察觉实验者的意图。

模仿是种强烈的本能，在许多文化行为的学习上扮演着关键角色，尤其是语言的学习。最先在猴子大脑里所新发现的镜像神经系统（Rizzolatti and Buccino 2005；曾志朗2006:72－5），也许提供了模仿的生理基础，因此也鼓舞了近年来的许多研究。慢慢地，幼儿成长中的大脑开始有了专属的分工，习惯了周边环境的景象、味道、声音，并特别关注该环境下有助于识别人与物的那些辨义特征，包括识别不同的语音。当这些确定的功用（commitments）适应了母语的环境后，儿童留意非母语语音的能力就会退化，这种退化可能在他们满周岁前就已经发生。

图4 婴幼儿脑发展示意图

注：纵坐标：脑重量（单位：克）。横坐标：生理年龄（单位：岁）。横坐标前两个点为“出生”和“三个月”。阴影处文字（从上至下）：正常脑重量、语言习得、侏儒症患者。图中将尸检时测定的脑重量作为患者生理年龄的函数，数据出处Coppoletta and Wolbach（1933）。底部绘线：Seckel（1960）所述患者头围各个时期的测定数据，折算为脑重量的估计值。

最近另一项杰出的研究发现，儿童能够记住环境中不同刺激出现的频率，例如一串连续语流就是诸多的刺激。八个月大的婴儿只要重复听到几分钟无意义的音节，就能觉察出其中反复出现的模式（Saffran,et al.1996:1926－8; Saffran,et al.2008:479－500; Aslin and Newport 2009:15－29）。这种从一连串的刺激中抽离反复出现的部分、并予以留心记忆的能力，叫做统计学习。这样的能力很明显地可以跨领域运用，从事一般的学习，但它也特别有助于儿童把语流划分成许多小单位，以辨认哪些组块（chunks）可能是一个词。

无数的人与物在儿童面前出现又消失，就像万花筒里转个不停的图像，所以只有当他们把那许多小单位配上可能的名称时，才能够将声音和某个面孔或物体联结在一起。许多不同形式的线索，都可能有助于建立联结，那些线索也许只是以目光或手指指向某个出现在眼前的食物或玩具。孩子最先会说的词，通常是称呼时空上靠近自己的那几张至关重要的脸孔，接着才扩展到全面的语言能力。语言像是一套庞大精密的归档系统，得把无数可分解的经验分门别类，而这些经由统计学习所抽离出的小组块，就是第一批归了档的资料夹，以便存取那些片段的经验或语义。

一旦儿童理解了音节可以承载意义，他们的认知发展便向前跨越了一大步，这个阶段常被称作“词汇爆增”（lexical explosion）的时期（见图5）。正如下面这段引言所表达的，梅莉（Meri）在一岁半之前，说的话主要是单一的词（MLU＝mean length of utterance平均话语长度）。但此后的一个月词汇爆增开始了，她的总词汇扩展了一倍，从30个词增加到70个。词汇爆增之后，她开始会把单词组合起来，随着平均话语长度增长，她也开始探索语法了。有趣的是，爆增后的一段时间内，词汇习得便维持停滞状态，仿佛此时她把全副精力都用来组织语法。

……在共计五次、历时三个半月的实验期间内，也就是从一岁三个月到一岁六个月大时，梅莉的平均话语长度维持在1.0左右。从一岁六个月大开始的实验期起，梅莉的总词汇从三个礼拜前的30个词猛增到70个。一岁七个月大起，紧接着词汇爆增，她的平均话语长度也开始增长，并一直持续到下一个和最后一个实验阶段，亦即一岁八个月大时。在这个句法迅速发展的时期，梅莉的平均话语长度由1.0增到1.6，但她的总词汇却不再进展，维持在70个词。（Anisfeld 1984:109）

图5 梅莉平均话语长度增长率变化示意图

注：纵坐标：平均话语长度（MLU）。横坐标：词型数（词汇量）。本图显示McCune-Nicolich（1981）研究的一个儿童梅莉平均话语长度的增长率变化，该数值为她词汇量的一个函数。

模仿和统计学习这两种能力，让儿童能学习周遭的社会环境，是演化赋予儿童的诸多能力之一。另一个关键能力是记忆——不仅要长期储存无数的词汇和句型，还要能借由断句（或组块），来记住一串话语或一组物品，亦即把特定时空下出现的物品按照可能的概念分组，以便给予它某种层级结构。例如，若有一串如下的二进位数字：

111110101100011010001000

绝大多数人都会觉得不易记牢，除非是反复练习许多次。但是如果把它转成熟悉的十进位或十六进位法，那么这串数字就好记多了。要能理解长句子，不管是说的或写的，基本上也需具备类似的断句技能。

111,110,101,100,011,010,001,000＝7 6 5 4 3 2 1 0

1111,1010,1100,0110,1000,1000＝F A C 6 8 8

Feigenson和Halberda（2008:9929）的实验证明，14个月大的幼儿就已经具备这样的断句能力。如果一组东西能够分出最为熟悉的组别，像“车”或“猫”，或是依空间距离分为更小的组别，14个月大的孩子就比较容易记得一共有多少件东西。但是如果涉及不熟悉的物品，或这些物品没有依照空间分组，他们就会觉得任务难得多。更有趣的是，这些研究人员注意到“14个月大的幼儿就能运用层级重组来扩展记忆，但年纪稍大的学龄前儿童，却需要实验者清楚地解释才办得到。”他们因此推论，“自发控制记忆重组的能力，会随着发育而经历重大改变。”

儿童时代运用过的某些技能，不是不可能随着儿童对环境认识越来越深而又得到重组运用。最近文献里的另一个实例，是仅仅8个月大就能在一连串声调的统计学习实验中识别绝对音高的幼儿（Saffran and Griepentrog 2001:74－85）。我们大多能够辨识，下面四组连续的三音符序列都代表do re mi三个音，虽然它们的相对音高不同：

只有具备绝对音高能力的人，才可以不靠任何已知的音高作参照，就知道他听到的是四组中哪一组音符。其实具备此种技能的人凤毛麟角，即使在专业音乐家中也很罕见。据估计，在欧洲和北美洲的一般人口中，约只有少于万分之一的人有这种本事（Deutsch,et al.2009:2398－403）。

显然，如果涉及音高，多数情况下通常是相对音高比较有用。音乐上能辨别乐曲调子通常比较重要，不管唱的是男声或女声，也不管唱的是C调或D调。同样地在言语感知上，能分辨两个声音说的是cóntract或contráct、má或mà也重要得多。当儿童越来越融入环境的文化，他们也明白了绝对和相对音高这两种技能间的差异，于是根据Saffran和Griepentrog（2001）的实验结果，慢慢地他们就放弃了绝对音高，而偏向于相对音高。换句话说，由于要适应文化的需要，儿童的音高感知模式就会重新组织。这样受语言和音乐影响的重组，在我们发育中可能是相当普遍的。下面谈颜色感知的时候，还会讲到一个例子。

要是我们考虑的情况是声调语言，那么结果就更有意思了，声调语言里音高扮演了区分字义的关键角色，Deutsch等人就做过这方面的探索（Deutsch,et al.1999:2267）。我们最近的实验也涉及这个问题，并在Sapir·一Whorf假说的框架下，让更多受试者测试。这一点下面还会再做一些探讨（Peng,et al.in prep.）。

7.Sapir-Whorf假说

我们总是理所当然地认为，有个“真实世界”是所有人类共享的，不管我们说的是哪种语言。然而，早在1929年，Sapir就提出了质疑：

事实上，“真实世界”或多或少会不知不觉地构筑于群体的语言习惯上。没有哪两种语言能够如此类似，以至于可以认为它们代表相同的社会现实。不同社会所处的世界都是不同的世界，而非仅仅是贴上了不同标签的同一个世界……我们社群的语言习惯已为我们预先选定了特定的诠释法，所以我们才会有这样的所见所闻乃至经历。（1929:209－10）Sapir的学生Whorf又把这种观念发扬光大，不管在人类学界还是语言学界，他的文选都是学者在论及此大名鼎鼎的假说时，经常引述的作品（Whorf 1956; Kay and Kempton 1984:65－79）。

无独有偶，基本上同样的概念在另一学科的省思中也看得见，上面提过的遗传学家Jacob，曾写过下列这段话：

令语言独一无二的特质，与其说在于它能沟通指令促成行动，还不如说在于它的象征能力，能引发认知意象。我们都用自己的词汇和语句来塑造“现实”，就如我们靠视觉和听觉来塑造它。人类

语言的无所不能，也让它成了发展想象力的绝佳工具（1982:58）。换句话说，我们从社群里所继承的语言，对我们理解这个“真实世界”有着很大影响；不同文化里的不同语言，会塑造出不同的真实世界。不同语言里的词汇，会导致我们对世界的所见所闻也不同。把Sapir-Whorf假说置于这样的感官框架下，让我们能进一步验证这个假说是否站得住脚。

我们先暂时跳出语言，考虑一个一般性问题。有位德国医师在两百多年前就曾说过：

运用和发挥心智能力，是否会慢慢改变大脑的物质结构，就像经常锻炼的肌肉会变得更结实？并非绝无可能，只不过解剖刀还无法轻易证实这点罢了（Samuel Thomas Soemmering 1791，转引自Restak 2003标题页）。

其实我们根本不需拿解剖刀在大脑上比划，现在借助脑成像技术就能得到类似的结果。越来越多研究显示，音乐家的大脑明显地异于非音乐家的。那么早在出生前就长期沉浸在一个语言中的大脑，难道不会使其构造异于沉浸在另一种语言中的大脑吗？

我们都生在一个由语言所定义的文化中。随着语言各异，大量使用某种语言，尤其是在出生前就如此，会把大脑塑造成不同的样貌。Sapir-Whorf假说预测，因语言而异的大脑，会以各自独特的方式影响我们对世界的感知与行为。就这个观点来看，近几十年来才发展出来的新科技，使我们更有可能验证此假说的真伪。

Kay和同事们（Gilbert,et al.2006:489－94; Franklin,et al.2008:18221－5; Kay,et al.2009）近来所作的一系列实验，正是朝这方向迈出了一大步。他们给受试者看一些围成一圈的色块，要他们不出声地按按钮，来指出颜色不同的那个异数（oddball）是在左半圈或右半圈。实验的主要发现是，异数的颜色如果和它周围的标准色块不同，例如英语中的blue（蓝）对green（绿），那么这个异数的色块若位于右视野区，左大脑的反应就会比右大脑快（见图6）。这个发现在韩语（Roberson,et al.2008:752－62）和俄语（Winawer,et al.2007:7780－5）的颜色词实验中也被证实了。

依照Sapir-Whorf假说的想法，我们可以推论左脑优势是由于颜色词在左脑里较容易提取，于是词汇上的协助便加速了识别异数色块的过程。后续的fMRI研究也支持了这种推论，论文的题目是“大脑的语言区域在颜色感知上也发挥功效”（Siok,et aL.2009:8140－5）。这一系列视觉感知的研究，在最近一份实验结果的评论中被称作“偏侧化的沃尔夫”（Lateralized Whorf，见Kay,et al.2009）。

图6 左右大脑色块异数实验结果

注：A中G1和G2色块为“绿色”，B1和B2色块为“蓝色”。C中灰色柱状体指左大脑区，白色柱状体指右大脑区；左边图为异数颜色与周围色块不同的情况，右边图为异数颜色与周围色块相同的情况。

Kay等（2009）同时还谈到另外一个非常有趣的发现，就是婴儿还没有学到这些颜色词的时候，他们辨别颜色的能力是右脑比较强，然而学了这些词之后，这个能力就移到左脑去了，大概是因为这些词存在左脑里。上面我们讨论过儿童的音高感会有重组现象，这里的颜色辨别又是一个重组的例子。

8.声调语言和汉字

再回到绝对音高和声调语言的讨论，我们似乎找到了另一个支持Sapir-Whorf假说的证据，而这次例证来自听觉感知的实验。以早先Deutsch等（Deutsch,et al.1999:2267; Deutsch,et al.2009:2398－403）为基础，彭刚等人（Peng,et al.in prep.）测试了广州几所音乐学院的学生②，并把他们在绝对音高上的表现和另一组受试者比较。彭刚的受试者母语为声调语言，都讲普通话，而他用来对照的另一组受试者母语则是非声调语言，亦即英语。

对于这两组受试者，我们也记录了他们开始接受音乐训练的年龄。图7显示的，是这些音乐家在判断绝对音高时，判断的平均正确率与开始学音乐的年龄的关系。我们可以清楚地看出，操普通话的受试者成绩一直高于操英语的人，其差距明显地具有指标意义。同样有趣的是，非声调语言的受试者，从五岁起成绩就开始大幅滑落；说声调语言的受试者，要等到八岁才开始有相应的下降。这表明，声调语言的环境把保留绝对音高的能力延长了约三年（见图7）。

图7 音高判断正确率与开始音乐训练的年龄的关系示意图

注：纵坐标：正确率。横坐标：开始音乐训练的年龄。线图从上至下：说声调语言的；说非声调语言的；随机。

声调语言对音高感知有影响的这项研究发现，和我们实验室的另一个实验结果一致。该实验中一组受试者仍是说普通话的，另一组非声调语言的受试者则说德语。他们在实验中会听到一连串计算机合成的纯声调，从标号#1斜度最陡峭的升调，到标号＃11的平调，如图8所示（Wang 1976:61－72）。受试者每听到一个调，就需将其归类为升调或平调（如下图）。

图8 音高感知实验设计

首行：左，开始频率；右，结束频率。纵坐标：刺激编号。横坐标：0.1秒、0.4秒。

根据受试者所提供的答案，可以画出两条相交于正确率50％的曲线，那里即是两组刺激的界线。由每个实验刺激所画出的图9中所显示的X形曲线，我们可以计算出界线宽度（boundary width）。这两组受试者，对那些不熟悉的实验室合成声调的反应相当不同，正如图10清楚显示的，说声调语言者的界线宽度大大地窄于说非声调语言者的。

图9 音高感知实验得分

注：纵坐标：反应得分（百分比）。横坐标：刺激编号。

图10 界线宽度

注：左为声调语言；右为非声调语言

不管是说出熟悉的音符或标示不熟悉的纯声调这两种情况，操声调语言和操非声调语言的受试者，在音高感知的表现上都不同。这为Sapir-Whorf假说提供了听觉证据，就像偏侧化的沃尔夫提供的是视觉证据，而听觉和视觉正是我们建构真实世界时最主要的两种感官。音高感知的实验显示，说和听有词汇辨义功能的声调，会影响语言之外的音高感知。色彩感知的实验则显示，语言里用来切分、命名颜色光谱的词汇，也会影响判断颜色时的反应。当然，颜色词会随时间而变迁，所以语言的声调也会随着时间而改变。

现在再谈一例文化如何影响感知。这个例子牵涉到汉字的书写（Peng,et al.2010:416－26），采取的实验方法是EEG（脑电图）的一种，叫做ERP（event-related potential事件相关电位），这种方法近几十年来应用尤其广泛（Sutton,et al.1965:1187－8.）。众所周知，世界上主要有两大书写系统，拼音字母与汉字，虽然这两种系统也各自存在许多变体（Daniels and Bright 1996; Wang,et al.2009:386－1417; Wang and Tsai 2010）。汉字书写可追溯到3500年前，这几千年来也经历了不少重要变革。1950年代起，政府进行了大规模的汉字简化运动，目的在于提升识字率。

简体字主要用于中国内地，但香港、台湾地区则继续使用繁体字。此外，地区性的字也应运而生，多半用于地方刊物。例如在香港，曾有人收录并分析超过1000个这类的常用地方字（Cheung and Bauer 2002）。

这些地方如何教授阅读，也各异其趣。以拉丁字母为基础的汉语拼音，于1950年代开始采用，在中国内地广泛推行，学生很早就得学习，以方便老师教授阅读。台湾用的则是注音符号，这套标音系统是1930年左右创立的，主要是以传统文字学里汉语音节的声母、介音、韵母的三分法为基础。跟这两地情况大不相同的是香港，学生早年受教育时，并不特别学习辅助的标音法来阅读汉字。

图11 实验中用到的汉字/非汉字列表

注：左栏为A组，右栏为B组；下面各为汉字和非汉字。

我们的实验目的是想调查，中国内地和香港的受试者，对一组简体字和繁体字里通用的汉字，其大脑如何不自觉地反应。我们从那些两种字体写法一样的汉字里，设计出了两组非汉字，一组是在原有的字里增加一笔画，另一组则是减少一笔画（见图11）。受试者在做实验时，需得从事一件不相关的任务，即数出计算机屏幕上出现几个圈（o）或叉（x）。但当他们做着这件不相干的计数工作时，屏幕上会很快闪出汉字或非汉字——大概只维持50毫秒。这样短的时间，只够让我们瞥见某些模式，但还不至于认出它们来。虽然有受试者的确看到汉字闪过，但没有一位能识别出那些是什么汉字。用心理学上谈感官的术语来说，这些屏幕上闪现的刺激，既不是潜意识的（subliminal），也不是意识之上的（supraliminal）。因此，我们实验的标题就用了“门槛的”（liminal）这个形容词，因为那些刺激所出现的时间，刚好只到了视觉感知的门槛。

图12所显示的，是从两组受试者的两个电极所取得的ERP电位，其示意简图则见图13。从图12的b栏可明确看出，内地受试者的大脑，对汉字的反应远比对非汉字的反应偏于正向。在刺激开始后的300毫秒左右，电位就开始偏正，而且一直持续到600毫秒后。相反地，c栏所显示的香港受试者就没有这种分别。他们的正电位在475毫秒左右就下滑了，而且此后一直维持下降。因此，书写文字对不知不觉中的感知所产生的文化效果非常真实。不过我们得再进一步探索，才能对此发现提供有说服力的解释。

图12 普通话/粤语使用汉字/非汉字反应实验ERP电位对比

注：粗线：汉字；细线：非汉字。虚线隔出的区间：P300窗口（275－475毫秒）。（a）所有受试者；（b）普通话受试者；（c）香港粤语受试者。

图13 普通话/粤语使用者汉字/非汉字反应实验对比结果

注：纵坐标：估测边际均值（单位：微伏）；横坐标：普通话、粤语。实线：汉字；虚线：非汉字。

此处所观察到的大脑反应，在脑神经语言学的文献中曾被广泛探讨过，通常称作P300。我们现在知道这种ERP的来源复杂，其中至少包含两个相异的成分，P3a和P3b，每个成分涉及的认知功能不同，神经回路也是分开的（Polich 2007:2128－48）。持久的正电位可能是3b造成，反映了中国内地的受试者在下意识里会更积极地提取汉字（Donchin and Coles 1988:357－74）。而大幅度的P300则可能是由文化因素造成的，因为中国内地学生对汉字的接触经验比较密集，但香港学生却多半在中英双语并行的文字环境下成长，所以中国内地读者对汉字字形更为敏感。虽然我们还须有后续的研究才能得出明确的解释，但这两个文化群体所呈现的ERP差异，却已经相当明显了。

9.总结

再把大纲复述一遍，我们对语言演化的早期了解，来自古代的哲人，特别是荀子和柏拉图，他们都认识到语言是从社会互动和约定俗成的过程中涌现出来的。宋、元时代，也就是约1000年前，韵图里已经清楚地谈到音节的发声基础，也提到了虚化的过程。陈第则靠着他对语言在时空里变迁的观察，研究古汉语的音变。

Jones最早发现语言间的亲属关系，为演化语言学的系统研究奠定基础。从那时起，演化的研究便一步步地变得更加丰富，多亏了有达尔文的天择、孟德尔的基因、Cajal的神经元、双螺旋结构的发现、监看血液流量及电位改变的脑成像技术等指标性进展，而这些研究之所以有成，多半得力于统计法和计算机科学不可或缺的支援。

同时，语言学家这一百多年已搜罗了全球许多地方约几千种语言的大量基本资料。这些语料，包括来自不同语言的语言习得资料，因为有了语料库形式的资源，多半在网络上也很容易取得。如果我们能有所选择地把这些研究进展的成果，跟其他相关学科结合来研究语言演化，那么语言研究的突破必定也是指日可待的。

我们当前的研究目标，就是要了解语言怎样影响大脑的发展。我们每个人从出生开始，就每天都在语言环境里活动，不只是听得到、看得见的语言，还包括沉思冥想时的语言，所以语言每分每秒都在影响大脑。大脑是个可塑性极高的神经系统，所以不同的语言会塑造出不同的大脑，由此也引发不同的行为，创造不同的文化，这就是Sapir、Whorf、Jacob等人的想法。我们期望能把这些想法通过实验具体地研究出来。其实达尔文在他1871年的书里就已经思考过这个问题，并且把大脑的使用与功能两者的互动关系讲得很清楚。这里笔者就引用这位演化论始祖的话来做个结尾：

“随着我们越来越经常地使用语音，发声的器官应该会遵循用进废退的原则而更臻完美；这也应该会对言语能力产生作用。可是语言的持续运用和大脑发展之间的关系，无疑更加重要。远古的人类老祖先，一定早在开始运用最不完美的言语形式之前，就已经比任何现存的猿类都具备更高度发展的心智能力；然而，我们也许可以自信地认为，持续地运用与提高这种能力，应该也会对心智产生作用。”（Darwin 1871:57）

注释：

① 香港中文大学有两组研究团队为CHILDES语料库贡献了许多中文语料；分别是李行德教授所领导的语言获得实验室（Language Acquisition Laboratory），以及最近新成立、由叶彩燕教授与stephen Matthews教授所负责的儿童双语研究中心（Childhood Bilingualism Research center）。类似的目标也促成了汉语方言资料库的建构，不过该计划并不像CHILDES那样引发了广泛的合作（Cheng 1994:71－86）。

② 特别感谢中山大学的苏丹洁为我们联系广州的音乐学院。

标签：语言学论文;

进化语言学的演变_语言学论文

猜你喜欢