演化论与中国语言学,本文主要内容关键词为:语言学论文,中国论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
“没有演化论的照耀,生物学里的一切都是暗淡的。”①
20世纪开始的时候,德国的一位数学权威David Hilbety,在巴黎举办的国际数学研讨会上,作了一场精彩的讲演。他在演说中提出了23个在数学的各个分支领域中,最有趣而有待解答的问题。Hilbert的23个问题,综合性地给了数学一个回顾,同时也给了它珍贵的推动力。Hilbert这种做学问的方法,也获得其他学科的赞扬及模仿。比如说,前几年,系统神经学就有人编纂了一部巨作②,罗列出了他们学科里最值得研究的23个问题,以供大家讨论。
不过拿数学来做语言学的借镜,仍有不甚妥当的地方,因为数学毕竟不是一门实证科学(empirical science),它的目的不在于解释宇宙中的物理或生物现象,而是只用推论的逻辑,建构自己内部的思想体系。③
相反地,语言学的确有具体的研究对象,那就是语言。当然我们研究语言的时候,能够运用某些强大的数学工具,以对语言有更深入的了解,这是很应该做的事。④可是语言现象通常比许多物理现象复杂,要发掘恰当的数学工具来配合语言学里的问题,不是一件容易的事。
不同的语言现象,当然需要不同的数学工具来配合。比方说,用统计方式分析儿童习得语言及语言演化的过程,就已经获得了一些很好的成果。⑤相反地,近年来有些形式语言学家硬要把语法当做一套像代数的系统来研究,这就不免有些削足适履,有时候甚至把一些很简单的句子分析得非常抽象和复杂。最近我们越来越觉悟到人类能够使用语言,是由于我们有非常丰富及发达的认知能力为基础。如果没有这些人类特有的智能,根本就不可能有语言。
语言是从人类原有的认知能力发展出来的。远从生物演化开始时,认知能力就已逐步发展,而语言只有几万年的历史。如果只局限在语言的小框架中去理解人类如何使用语言,那就犯了本末倒置的错误。可喜的是,最近语言学又慢慢地回归实证科学的正途。关于这些认知能力,我在下面探讨语言与大脑的段落中,会有进一步的说明。
刚才我提到系统神经学,它当然是一门实证科学,它所研究的对象是大脑。人类的语言跟大脑关系密切,两者间存在一种独特的互动,没有大脑神经系统的种种功能,如它庞大的记忆能力、快捷的计算能力,以及它组织听觉、视觉与嗅觉等的跨模式联结(cross-modal association)能力,语言势必无法存在。但是这些能力也不是只用在语言上。例如音乐和数学,也必须充分运用这些在人类大脑里发展程度最高的能力。
反过来说,大脑的演化也不断受语言的影响。而这个影响最明显的是短期的,不过人的一生中,这种影响也有一定的累积性,会一代一代传下去。所以它既是个体演化(ontogenetic evolution),而通过个体演化的累积,也是群体演化(phylogenetic evolution)。神经系统是生物演化的产物,可是语言却不同。语言是先天生物因素与后天文化环境两种条件交互作用而演化出来的。
语言跟生物界的产物最基本的差异,就在于语言不是一个器官,而是一种行为。呼吸是一种行为,而肺是一个器官;同样地,看是一种行为,而眼睛是一个器官。肺脏、眼睛等人体器官,都是生物经过数千万年的演化才形成的,比较起来,语言约十万年的历史就显得非常短暂,不可能单靠生物演化而来。
语言之所以如此丰富、多姿多彩,是因为语言让人类建立了文化,并且是文化的根基。语言跟文化的这种关系,蔡元培很早就提过。⑥文化演化不依靠缓慢的基因传播,而是每一代里都可能有很大的变化,如从农业社会进入工业社会,从真空管到半导体等等。从Von Neuman发明第一部电子计算器,到目前迈入互联网Internet的信息时代,其中经历还不满一百年呢。原始语言的形成,建立在生物演化(biological evolution)所提供的基础上。可是经由语言产生文化以后,文化演化(cultural evolution)又促使语言的发展一日千里。所以这两种演化方式各有千秋,缺一不可。
中国的语言除了汉语,还包括境内几百种阿尔泰语、藏缅语以及南亚南岛语,包括苗、瑶、壮、侗语等。研究中国语言学,便涵盖两个层次的目标。狭义来说,最主要的目的,是帮我们了解中国的文化历史,因为语言是文化最全面性的结晶,语言学可以借助科学手段,推论出上古时代汉语的发音;语言学也可以帮我们解释四书五经里的语法、用词;语言学还能够通过词汇结构及相互传递,让我们了解民族间的交往关系,以及他们独特的风俗与传统。
广义来说,中国语言学的目标是借由对中国语言的认识进而研究人类的语言。中国语言具有一些重要的特征,一是利用声调辨别词义,二是少用构词的屈折,三是使用方块文字,这些都是19世纪前的西方语言学家不曾想象到的,况且曾经存有许多误会和偏见。我们当然有责任把我们境内的语言材料记载下来,将它们与世界上别的语料归纳统整,让我们对人类的语言能有更深刻完整的科学认知。
我想借这个机会,很简短地谈谈近年来研究的三个问题。第一个问题是关于语言的涌现,它的词汇与词串的顺序是怎样形成的。第二个问题是关于语言在大脑里的运作方式。第三个问题则是个性语言与共性语言的分别。最后我会针对语言研究的范围,做个统整的结论。
一 语言的涌现
由于近年来遗传学和人类学的一些新发现,我们可以比较有根据地相信,语言是在距今十万年至五万年这段时间内,于非洲及欧亚大陆逐步涌现的。涌现的两个基本条件是:(一)这个群体里的每个人都应知道,一串声音能代表任何一样东西,也就是说,他们了解符号这个核心概念。(二)这个群体要大致同意,什么音串代表什么东西,这就是荀子所说的,名无固宜,约定俗成。所以说汉语的群体都要同意,“水”这个声音,代表的是而不是别的东西。可是语言除了词汇里的“名”之外,我们也该同意“名”跟“名”在一串声音里的次序及结构关系。例如,“狗咬人”与“人咬狗”代表完全不同的概念。所以除了词汇以外,也一定要有语法,语言才能涌现。
在这个问题上,我们作了一些建模仿真的研究。用计算机程序里一些虚构的群体,来探讨不同的沟通环境。我们可以用n(number of agents)来代表这个群体的大小,比方说,n=30就表示这个群体里有30个个体,u(utterance)代表每个个体能发出的不同声音,m(meaning)代表每个个体想要表达的东西。例如,u=m=10,就表示每个个体能用10种不同的声音来表达10个不同的东西。
每个个体都可以由两个表格来呈现,一个是其发音表,一个是其听音表。表里的每一列是不同的东西,每一行是不同的声音。我们用两个表的原因在于,每个人能说出的话语,只是他所能听懂的话语中的一部分,很多别人说的话他听得懂,可是自己却不习惯或不会这么说。而表中行与列交叉的每一格里,就是代表概率的数字。要是一个个体的听音表里,行与列交叉的格子中概率等于1,那就表示他听到时,一定会知道说话者所指的东西是。如果格子中的概率小于1,那就表示他可能会把听到的语音理解为其他的东西。
仿真实验开始的时候,每个个体两个表里的概率,都是随机填进去的。这时候是各说各话,可以是水,也可以是mizu,也可以是agua,还可以是别的音串。因为这个阶段,还没达到约定俗成的目标。
实验进行中,我们随机挑选一对个体出来,譬如说,张三对李四说如果李四从他自己的听音表里,理解到是,而这个理解如果恰好是正确的,那么这次沟通便是成功的。这时我们就在张三的发音表和李四的听音表里,于的格子中加上一个小数目delta,以表扬此次沟通成功。可是若李四理解到的并非,那么就得在这格子里,减去delta,以代表此次沟通失败。
这样的实验其实非常简单,程序的运作很容易,所提到的参数也非常有限,就是小写和delta。可是这个实验已经足以证明,在类似的原始环境里,约定俗成是大有可能的。换句话说,十万年前分布在欧亚非陆地上的诸多原始群体里,语言涌现是相当自然的沟通结果,而且不同的语言是在不同的时间空间下涌现出来的。⑦
我们当然可以把这样的实验复杂化,增加它的参数,在程序里加入许多不同的路径,可是它最终的方向都会相同。我们朝着这个方向也有了些进展,我们发现,这些虚构的个体,很快就能把一条长的音串,分解为几个各有意思的短音串,就像是把“小狗”里的“小”和“狗”经由断词而分出来。我们也发现,词汇不需要很大,词与词的次序也会渐渐地规范化而约定俗成,走上原始语法的道路。
我们的研究结果,大部分已经发表在某些期刊里。龚涛和柯津云⑧两人,都从建模来探讨语言涌现,从他们已发表的文章中,我们可以对这方面的研究有更进一步的了解。⑨尤其是这一两年,龚涛有不少新发现⑩,鉴于篇幅有限,我在此就不提了。另外,James Minett也跟他们一起用建模的方法,研究了语言消失的一些问题。(11)比如说,什么时候抢救濒危中的语言会最有成效。我们最近也在这方面发表了一篇相当详尽的报告。语言的濒危或消失,当然是由于跟其他语言接触与竞争;在这方面,潘悟云(12)、阿错(13)及汪锋(14)都作了宝贵的贡献。目前邹嘉彦在海南三亚及广西南宁的田野调查,也将为我们对这方面的理解,提供珍贵的材料。(15)
二 语言与大脑
现在我想简短地谈一下我们最近开始研究的另一个课题,就是语言跟大脑的关系。很明显地,人类发明语言,最重要的因素取决于大脑。别的动物虽然也有群体生活,彼此间也相互沟通,并且有互相模仿,甚至有母亲教导子女的行为,可是它们不但没有发明语言,而且也好像根本就学不会比较复杂的人类语言。所以语言究竟如何在大脑里运作,是语言学的核心问题。
演化生物学告诉我们,黑猩猩(chimpanzee)是生物圈里跟人类最接近的动物,这两类大约是在六百万年前分歧的。三四百万年前,我们的老祖宗已经变成直立行走的动物,而其整个身体也随之演化,尤其是大脑新皮质(neocortex)的体积、容量以及内部结构,变化最多也最显著。在这方面,Schoenemann曾经作过很重要的比较。他发现我们的大脑比起黑猩猩的大脑增加的体积,最显著的是新皮质的前部分。(16)以下的图取自他的文章。
Figure 5:Difference in absolute size of the prefrontal vs non-prefrontal areas of the cerebrum of humans compared to chimpanzees(Pan troglodytos and Pan panlscus).Gray matter is primarily neuron cell bodies,dendritic connections,and their glial support cells,whereas white matter is primarily long-distance connections between regions.
我们可以把语言的产生想象为一幅马赛克镶嵌画(mosaic),整个画作是一片一片逐步拼凑而成的。语言里有很多现象,都是建立在大脑已有的功能上的。不过由于文化与语言相辅相成、相互刺激,这些功能发展得特别快而已。知名的心理学家David Premack最近曾提出Is language the key to human intelligence?(语言是开启人类智能的钥匙吗?)这个问题,其实我们也可以把他所提到的这两个概念前后置换,肯定地说:人类智能是开启语言的钥匙。如果没有构成智能的重要成分,如记忆、感知、归纳、模拟等能力,语言是不会涌现的。我之所以用马赛克镶嵌画这个比喻来说明语言,正是基于这个想法。(17)
这种说法也与遗传学家Francois Jacob的主张不谋而合。早在三十年前,Jacob就表达过类似的言论,“……并不晓得他会做出个什么成品……只是手边有什么就拿什么来用,于是旧纸板、短线头、木头或金属碎片都好,就这么将就着拼凑出一个可以用的工具……生命体是历史的结构,亦即历史的产物。他们代表的不是尽善尽美的工程杰作,而是当机缘巧合时由零星的对象补补贴贴凑合而成的作品”(18)。
大家都看过大脑的图片,它的表层有凸起的脑丘(gyrus),也有凹陷的脑沟(sulcus),形成了很深的皱纹,这是因为新皮质在这五六十万年里增长得特别快,这种快速增长是生物界里人类所独有的演化过程。
语言里的很多现象,可以从大脑的结构得到一些线索。比方说,我们知道时间与空间是我们理解世界的两个最基本的概念,在所有的语言里,很多词既可以用在时间上,也可以用在空间上。这种情形在介词的表现上最为明显,例如两天前的“前”是指时间,而房前的“前”是指空间。又如夜长的“长”是指时间,而路长的“长”是指空间。
可是语言里为什么总会有时间空间并用的词?要解答这个问题,我们可以参考知名的生理学家Karl Lashley半个世纪前说过的一番话:
“……我们相信,记忆的痕迹多半是静态且同时持续的,因此不得不假设,它们在空间上是有所分别的。然而,再现的记忆几乎都是以时间先后顺序出现,可能是一连串的词语或行为……因此,空间与时间次序在大脑的功能中似乎是完全可以互相交替的。从空间分布的记忆痕迹过渡到时间上的顺序,也似乎是序列问题上的一个基本要素。”(19)
所以大脑储存信息时,时间里有空间,空间里也有时间,语言中时空并用的那些词,不过反映出了大脑这样的结构。在同一篇文章里,Lashley也说过这么一段话:
“时间上的整合并非语言所独有;昆虫活动时腿部的协调、鸟儿鸣叫时的歌声……建筑师设计房子、木匠锯木头,这些行为都呈现出动作序列的问题……其中每一项行为,都需要具备类似句法组织的能力才得以完成。”(20)
一个句子里,往往会有有序列的层级结构(21),可以通过树形图来表达。当我们使用句子的时候,我们会作一种时间上的整合,以了解其内含的语意。Lashley的意思就是,这种运用序列阶层形态的能力,不限于语言,在其他动物以及许多我们日常生活所从事的活动中,都可以见到这种能力。譬如做一顿饭时,是要先切肉,还是先炒菜;下一盘棋时,是该先跳马,还是先飞象,这些都是类似的顺序问题。说话是一种典型的运用这种能力的行为,所以跟其他动作一样,是有序列的层级结构。为了探讨这类问题,曾志朗与我做过一系列的实验,来说明语言与其他动作的共同性。(22)
我们分析一个句子所用的程序,是大脑新皮质特强的一种功能。在这个领域中,许多实验已累积了二三十年的研究成果,我们最近获得了一套测量脑波的仪器,也开始朝这个方向探索。
我们知道大脑里有无数多的神经元,不断地互相传达信息。而这些神经元又组织成更多大大小小的神经网络,分布在大脑不同的位置上。每说一句话时,要通过大脑里很多网络控制口腔及喉咙里的几十块大小不同的肌肉来发音。(23)毫无疑问地,说话的确是人类所运用的最复杂的动作。有朝一日,如果研究结果能确实让我们知道,当人运用语言,譬如阅读一个句子,或者说出一个词语时,大脑是怎么操作的,就能让语言学研究再迈进一大步。
在2008年5月底出版的Science杂志里,(24)有篇文章探讨当受试者想到某个词,例如“celery”时,大脑里与这个词相关的颜色、形状、味道等神经网络如何运作。像这样史无前例的研究,在仅仅几年前大家会认为是不可能的。可是现在由于神经科学的理论与技术进步神速,此类实验能给我们不少的启发,增进我们对语言的了解。这是非常值得欣慰的。
我们目前正在使用电子脑波机(EEG)进行三个小项目的研究。一是研究阅读不同的句子时,脑皮上的电极会给我们什么样的电波。有些句子是正常的,如“经常吸烟会导致肺癌”。有些句子是在语意上有问题,如“经常吸烟会导致啤酒”。还有些句子是在语法上有问题,如“经常吸烟会导致看见”。黄俊杰(25)正在研究,P200和N400两种脑波与这些句子间的关系。他用的句子如下图所示。“药物”跟“山火”是句子里的目标词,也相对于图中时间坐标的0毫秒。“药物”的脑波曲线在上,“山火”的脑波曲线在下。这两条曲线最明显的区别,位于200及400毫秒前后的区块。大脑竟然在短短的200毫秒内,就能辨别一个句子是否在语意上有问题,我们觉得这的确是个有趣的发现。
另一个研究项目是关于声调的听觉。三十多年前就有人说过,声调语言里的声调是在左大脑处理的,帅兰的研究结合了双耳竞争和ERP脑波的方法,(26)让我们对这个问题有了更深一层的认识。我们听声调时,大脑至少需要分两个阶段,才能完成分析,而它与信号噪音的比率以及声调本身的升降都有密切的关系。我们也正在探索声调听觉实验上是否存在个别差异与性别差异。
第三个项目是关于声调的类别。我们知道,同样物理差别的两个调X与Y,可能是同类,也可能是异类。因为两个邻近的声调一定会有一条听觉界线,如果X跟Y都在界线的同一边,就会被听作是同一个声调。相反地,如果X与Y位于界线的两边,就会被听作是两个不同的声调。这种声调上的范畴感知(categorical perception),我在1975年纽约科学院召开的语言演化研讨会上,已经作过报告。(27)
郑洪英发现在电脑合成的语音环境中,位于边界两边的X和Y比位于同一边的更加容易分辨。但是具备同样物理特征的信号如果在电脑合成的非语音中,不论XY是否在声调边界的两边,分辨的难度都没有太大区别。(28)现在她在用脑波研究,这种与语言背景密切相关的声调分辨能力,如何反映在大脑中。她使用了一种新的脑波技术,叫做MMN——MisMatch Negativity(29)。她发现,虽然受试者正用心地看一部电影,他们的大脑还是在不知不觉地区分着,哪些声调是同类的,哪些是不同类的,而且大脑还会区分听到的是语音还是非语音,并对非语音的声调不进行分类。在这种不知不觉的情况下,大脑自动的反应,和后来集中精神作判断的情况非常接近。请参见下面的图例与图示:
三种测试群体对广东话三个平声调的辨别测试。CS代表香港本地学生听广东话合成语音,MS代表内地学生听广东话合成语音,CN代表香港本地学生听合成非语音(该非语音具备与广东话相同的声调结构)。柱状图表示对于两个声音的分辨正确率,*表示两者之间有显著差异(p<0.01),ns表示没有显著差异。AC代表两个声音XY在边界两边,WC代表两个声音XY在边界的同一边;LC代表要判断的声音在句尾,RC代表要判断的声音在句首。
这些语言跟大脑的问题,非常不容易获得百分之百有把握的答案。我们往往很难知道,电极上看到的曲线,是因受试者累了,不经意中眨了眼而产生一些不相关的电波,还是我们真正观察到了大脑运用语言的模式。不过,这让我想起一句俗话:“不入虎穴,焉得虎子。”无疑地,语言游移在我们大脑的网络里,所以不得不进入大脑中,直接研究它的运作。可喜的是,近二三十年来,系统神经学已有日新月异的进展。有人说,20世纪是物理学的世纪,那么21世纪可以说是生物学的世纪。我们应该趁着这股势头,抓紧这个时机。我们若能把语言学与神经学研究相结合,就更能开拓视野,获取更佳的研究成果。
研究涌现与大脑这两个大问题,已经有不少的文献。在这里我只能蜻蜓点水地略提一下。比方说,用最新的科技及工具来研究人类大脑,已有二三十年的历史,而曾志朗和洪兰在台湾从事这方面的研究,也已有十多年,并且成果丰硕。而在语音方面,孔江平研究声带抖动的波形,(30)许毅分析声调中的互动,(31)也为中国语言学带入了更多的科学方式。这都充分显示,中国语言学已循着科际整合的跨学科路线走了,这是个可喜可贺的研究趋势。
我们同时也必须注意神经科学(neuroscience)和遗传学有密切的关系,因为大脑的神经系统,毕竟是借由基因在不同的环境刺激下形塑而成的。几年前科学家发现了一种新的神经细胞,叫做梭形细胞(spindle cell)(32),这种细胞只存在于大脑中固定的“扣带回前部脑丘”(anterior cingulated gyrns)里,而且只有跟人类邻近的猩猩才具有这种细胞,不过人类大脑里的梭形细胞,却比猩猩的要多过好几倍。
这些特有的神经细胞,究竟如何由基因制造而成,而且哪些基因和语言有重要的关系,都是非常关键的问题。近年来,有几个基因特别引起了我们的注意,早期讨论较多的是FOX-P2,这个基因既然跟口腔肌肉的运作有关,自然会影响发音的功能。另外两个基因是ASPM及MCPH1,它们跟脑的大小有关。可是正如Fisher2006与Gontier 2008指出,这三个基因都只是调控性基因(regulatory genes),而非结构性基因(structural genes),它们不直接管理制造大脑的蛋白质。
“语言基因”这类的说法,不可否认地具有莫大的吸引力,可是Gontier(2008:178)的看法是,“有关基因本质的新研究资料,让许多传统的理论假说站不住脚,这些假说总是推论人类具有某种象征性的语言、文化或认知方面的基因”(33)。套一句《论语》中的话“知之为知之,不知为不知”来说明,我们当然很想知道语言的基因基础,以及语言涌现的来龙去脉,可是这个愿望仍然比较遥远,还需多年的跨学科研究才能厘清这个问题,就目前阶段而言,我们只能把这个“语言基因”问题归于“未知”。
三 个性与共性
70多年前,胡适在美国讲演时,说过一段很值得回味的话。(34)他把顾炎武研究语文的成就,拿来跟欧洲三位伟大的科学家伽利略、开普勒及牛顿相比较。这些人都是17世纪,也就是明末清初时代的人。他的用意是,虽然中国和欧洲在那时都开启了科学研究方法,但他们造成的影响却有天渊之别。胡适的结论是,中国人用科学方法开拓了三百年的书籍研究,而欧洲人却发明了一种新科学,(35)因此创造了一个新世界。
中国人在语文方面,的确很早就有过杰出的成就。汉朝的扬雄、许慎,都是世界上早期数一数二的语言研究专家。可是正如罗常培先生所说:
“可惜在中国语言史上发达最早的词汇学,从《方言》以后就黯淡无光了,不能使第一世纪左右已经有了的逼近语言科学的方法继续发展。”
怎么能让中国语言学再次发光而跃入最先进的地位,这是我们大家都十分关心的问题。几年前,李行德发表了一篇很长的文章,分析了中国语言学传统与西方语言学相同与相异的地方;(36)去年沈家煊又提到对语言研究的三点体会,(37)这些都是很宝贵的讨论。
有些语言,把个性语言和共性语言的词汇分得很清楚。虽然中文和英文不分,英文里只用“language”一个词来表达这两个概念。可是法文或意大利文就分:langue或lingua,指的是单独的语言或语族,如汉语、汉藏语族,而langage或linguaggio指的是人类共同的语言。在这方面,沈家煊说得很好,他说:
“共性和个性是分不开的,是一个铜板的两面。共性和个性是一个问题,不是两个问题。”
个性语言的研究,是以分析具体、个别的语言现象为主题,而共性研究则是参考这些分析的结果,建立一个综合性的语言理论。没有充分的个性分析,理论只是纸上谈兵;相反地,只注意个别的语言,而不思考综合性的问题,也会沦于钻牛角尖,而变得像罗常培先生所说的“黯淡无光”。
所以要中国语言学前进,我们不得不顾虑到语言学这枚铜板的两面,要经常把它翻过来看个仔细,统整地考虑共性与个性间的关系。这也就是我经常强调的“大处着眼,小处着手”(think globally,work locally)。要研究好中国的语言,就必须熟悉语言理论;相反地,语言理论若不包含中国多姿多彩的语言现象,根本就不配作为一套完备的语言理论。研究语言理论时,同时必须顾虑到一般演化论所提供的理论基础;就如本文一开始时所引T.Dobzhansky的那句话。
四 殊途同归
因为语言深入我们生活中的各个层面,所以研究它的方法及领域也变得众多且复杂。有些人从语言习得与教学的角度,有些从文字变化的角度来了解语言。(37)有些人则是着眼于大脑与思想,还有些人从人口历史与文化来研究古代的语言与语言接触。也有人从年龄差异及实验语音来看当今的语音演变。(39)另有些人则是借助信息理论与计算机,更有人从抽象的理论基础,来探究语法演变所产生出的一些语言类型。这只是我目前想到的几个范例,然而都足以呈现出语言学包罗万象、多姿多彩的性质。
也许有人会担心,语言学既然涵盖这么多层面,会不会将来分裂成好几个不同的学科,而使其中的距离越来越远呢?在这方面我是比较乐观的,因为语言毕竟是个相当统一的现象,虽然作研究时,会有不同的出发点,但研究的目标始终是语言。三十多年前,我第一次回国讲演时,曾经说过,为学有如金字塔,要能广阔才能高。(40)淮南子也说过:“百川异源,而皆归于海。”语言这个大海,是能容纳大量知识的。
我们现在再回到本文开始时提到的David Hilbert。他在1990年讲演时,也考虑过类似的问题,并且给了一个很清楚的答复。他说,
“尽管数学知识如此多元,我们还是能清楚地意识到逻辑推论的相似性、数学这一整体中不同观念间的关系,以及它不同学派下诸多的类比关系。我们也注意到,数学理论的发展越趋成熟,它的架构就越和谐一致,不同的科学支派间的关系也会一一揭露。因此随着数学的内容越来越广博,它的组织性不但不会因而丧失,反而会更清楚地显现出来”(41)。
比起数学累积了几千年的成果,以科学方法来研究语言只有短短数百年的历史。可是希望我们语言学的未来,也能像Hilbert的数学那样,越来越成熟,越来越巩固。最后,我们也同时要理解并接受一项事实,那就是研究语言很可能永远得不到一个尽善尽美的全盘解答,物理学家马克斯普朗克(Max Planck)曾经说过:
“科学无法解答大自然的终极奥秘,这是因为我们也是这个奥秘的一部分。”(42)
的确如此,我们每一个人,一出世就生活在语言的世界里。用它来与别人沟通,帮自己思考。很难想象要是人类没有语言,这个世界会变成什么样子,更别说要跳出语言的圈子,根本不用语言来解释语言这个奥秘了!这些想法套用苏东坡的两句话,也恰好能表达出来:
“不识语言真面目,只缘人在言语中。”
*这篇文章原本是为“语言研究视野的拓展”国际研讨会而写。该研讨会由上海师范大学潘悟云及美国麻省大学沈钟伟两位教授主办。由于上海机场大雾影响班机起降,我未能亲自与会,而失去机会跟很多师友交流,深觉遗憾。我在此感谢钟伟兄在研讨会上替我宣读这篇文章。我们语言工程实验室(Language Engineering Laboratory)的研究,是由香港中文大学信兴高等工程研究所及香港研资局共同资助。我也要感谢杨振宁、贝罗贝(Alain Peyraube)、梅祖麟、丁邦新、李壬癸等挚友的宝贵意见,以及特别感谢蔡雅菁小姐在我撰文时所提供的协助,包括校稿与翻译。文稿中难免还有不少疏漏之处,希望读者不吝指正。
注释:
①“Nothing in biology makes sense except in the light of evolution.”这是遗传学家T.Dobzhansky于1973年发表的一篇文章的标题。这几十年来,我们已经明白,演化论中的许多见解,也同样适用于行为科学。既然人类语言有坚实的生物基础,那么显而易见地,语言学的诸多方面,也最好从演化的观点切入研究。
②参见Van Hemmen &.T.Sejnowski2006.
③在这方面,让人很惊讶的是,虽然数学的出发点不在于解释宇宙里的任何现象,可是往往一套数学原理,却有助于我们理解,甚至发现新的概念。物理学家Paul Dirac就是一个很好的例子,他经由一套数学公式,发现了质子这个物理单位。Dirac打趣地说,“我的公式比我还要聪明”。
④关于数学的重要性,伽利略曾经说过:“Philosophy is written in that great book which ever lies before our eyes...We can not understand it if we do not first learn the language and grasp the symbols in which it is written.The book is written in the mathematical language...without whose help it is humanly impossible to comprehend a single word of it,and without which one wanders in vain through a dark labyrinth.”我想指出的是,伽利略时代所探讨的哲学,其实就是当今自然科学的研究范畴。
⑤Saffran,J.R.2002.
⑥蔡元培1928中研院《历史语言研究所集刊》,发刊词。
⑦Freedman,D.A.& W.S.-Y.Wang 1996.
⑧龚涛现在在德国莱比锡的马克斯普朗克(Max Planck Institute)语言学研究所,柯津云则在密歇根大学英语研究所从事研究。
⑨Ke et al.2002.Ke et al.2008.王士元2006a《演化语言学中的计算机建模》(Computational modeling in evolutionary linguistics)北京:《北京大学学报》(哲学社会科学版)43.17-22.
⑩Gong et al.2005a,2005b.Gong 2008.
(11)Minett & Wang 2008a,2008b.
(12)Pan(潘悟云)2006《中国的语言与方言》.见金力、褚嘉佑主编《中华民族遗传,多样性研究》.上海科学技术出版社.118-138.
(13)Atshogs(意西微萨·阿错)2005《语言深度接触机制与藏汉语言类型差异问题》.Journal of Chinese Linguistics 33.1.33.
(14)Wang,Feng(汪锋)2006 Comparison of Languages in Contact:the Distillation Method and the Case of Bai.Institute of Linguistics,Academia Sinica.
(15)邹嘉彦2008《寻根之旅,跟着语言走》,《科学人》8.40-43。
(16)"Our own study found that,whereas the non-prefrontal portions of the human brain were 3.7 times larger than the average for the two chimpanzee species studied,the prefrontal portion was 4.9 times larger." Schoenemann,P.Thomas 2005 Conceptual complexity and the brain:understanding language origins.J.W.Minett & W.S.-Y.Wang 2005 Language acquisition,change and emergence:essays in evolutionary linguistics.47-94.
(17)Wang 2007.
(18)"...often without knowing what he is going to produce,...uses whatever he finds around him,old cardboards,pieces of strings,fragments of wood or metal,to make some kind of workable object....Living organisms are historical structures,literally creations of history.They represent not a perfect product of engineering,but a patchwork of odd sets pieced together when and where opportunities arose."
(19)"Since memory traces are,we believe,in large part static and persist simultaneously,it must be assumed that they are spatially differentiated.Nevertheless,reproductive memory appears almost invariably as a temporal sequence,either as a succession of words or acts...Spatial and temporal order thus appear to be almost completely interchangeable in cerebral function.The transition from the spatial distribution of memory traces to temporal sequences seems to be a fundamental aspect of the problem of serial order."
(20)"Temporal integration is not found exclusively in language; the coordination of leg movements in insects,the songs of birds...the architect designing a house,and the carpenter sawing a board present a problem of sequences of action ...each of which similarly requires syntactic organization."
(21)sequential hierarchical structure.
(22)Tzeng,O.J.L.& W.S.-Y.Wang 1983.
(23)Wang 2008里有张表,列出了发音所运用的神经及肌肉,可供参考。
(24)Mitchell et al.2008.
(25)Wong 2008.
(26)Shuai 2008.Shuai & Wang 2008.
(27)Wang 1976.
(28)Zheng et al.2007
(29)Zheng 2008.
(30)Kong 2007.
(31)Xu & Liu 2007.
(32)Allman et al.2002.
(33)"The new data on the nature of genes,however,make a lot of the classic,theoretical assumptions on the existence of symbolic,language,cultural or cognitive genes untenable."
(34)"If we make a comparative chronology of the leaders of Chinese and European learning during the seventeenth century-the formative period both for the new science in modern Europe and the new learning in China-we shall see that four years before Ku Yen-wu was born(1613),Galileo had invented his telescope and was using it to revolutionize the science of astronomy,and Kepler was publishing his revolutionary studies of Mars and his new laws of the movements of the planets.When Ku Yen-wu worked on his philological studies and reconstructed the archaic pronunciations,Harvey had published his great work on the circulation of blood...The year before Ku Yen-wu completed his epoch-making Five Books on philological studies,Newton had worked out his calculus and his analysis of white light.In 1680,Ku wrote his preface to the final texts of his philological works; in 1687,Newton published his Principia.
The striking similarity in the scientific spirit and method of these great leaders of the age of new learning in their respective countries makes the fundamental difference between their fields of work more conspicuous.Galileo,Kepler,Boyle,Harvey,and Newton worked with the objects of nature,with stars,balls,inclining plantes,telescopes,microscopes,prisms,chemicals,and numbers and astronomical tables.And their Chinese contemporaries worked with books,words,and documentary evidences.The latter created three hundred years of scientific book learning; the former created a new science and a new world."
(35)语言对所有人来说都是充满自然的吸引力的,对那些自然科学界里的佼佼者当然也不例外。像伽利略这么一位伟大的人物,就曾说过下列一段赞美语言的话:“在所有令人激赏的发明中,有什么比得上人类高明的头脑,能够想得出如何将人最隐秘的思想,传达给任何其他人,不管这个人在时空上与他相隔多么遥远?若非这颗高明的脑袋,他怎么能在纸张上,通过二十来个小符号不同的排列组合,就轻易地沟通他的想法?在人类所有令人赞叹的发明中,这应当是最重要的一项标记。”
(36)Lee 2000.
(37)沈家煊 2007。
(38)Cheung & Bauer 2002.
(39)Shen 1990,1997.
(40)wang 1974.很多学者也曾发表过类似的意见,例如宋朝的朱熹。李壬癸先生最近告诉我,胡适在1925年的文章《读书》里也这样说过。
(41)"For with all the variety of mathematical knowledge,we are still clearly conscious of the similarity of the logical devices,the relationship of the ideas in mathematics as a whole and the numerous analogies in its different departments.We also notice that,the farther a mathematical theory is developed,the more harmoniously and uniformly does its construction proceed,and unsuspected relations are disclosed between hitherto separate branches of the science.So it happens that,with the extension of mathematics,its organic character is not lost but only manifests itself more clearly."
(42)Planck:"Science can not solve the ultimate mystery of nature.And it is because in the last analysis we ourselves are part of the mystery we are trying to solve."杨振宁先生1961年在M.I.T.开会时也表示过类似的想法。