历史音系学的新视野,本文主要内容关键词为:新视野论文,历史论文,音系学论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一 历史语言学的雄心:引言
十九世纪是历史语言学的天下。那个年代最后一批大将中有一位索绪尔,他二十岁上下就构拟了原始印欧语的元音系统,并假定了两个几十年后在赫梯语中得到证实的“喉音”成分。也就是他,后来改行另创共时语言学,一手将西方的历史语言学窒息了多半个世纪。如今,随着一些相关学科的有力进展,例如实验语音学、类型学、社会语言学和词汇扩散论、接触语言学和裂变—聚变论、数学和统计学等等,对于语言演化的研究逐渐成为兴趣焦点之一。而历史语言学作为其中一部分也重新崛起。因此,本文题目中的“历史音系学的新视野”可以理解为“相关学科的进展引起的历史音系学的开拓”。下文先总体概要介绍一下这些学科对历史语言学的影响和贡献,然后挑几个汉语研究的例子。在介绍之前,有两点要在文章开头突出一下:一是拉波夫的成就,一是奥哈拉的宣言。
拉波夫是研究共时语言学的,研究语音的社会变体。表面上看,与历史语言学不但无关,而且对立。但就是拉波夫对共时变异的观察,推翻了语言演变只能在发生后才能观察到的传统观点。这种从变化中的语言着手来探讨语言的变化,被认为是“当代语言学中最惊人的单项成就”[1]147。
如果说拉波夫的在共时中研究历时是当代语言学中最惊人的单项成就,那么奥哈拉的“实验重现历史”[2](凡是历史上发生的音变,都要在实验室里重现)的宣言便是历来语言学中最激动人心的目标。这是一个崇高的学术理想,而不是梦想。其实,就是梦想,也没关系;不但没关系,还应该有梦想。人类总是先有嫦娥奔月的美梦,才有阿波罗登月之壮举。而我们现在要做的就是从奔月梦到登月舱之间建立一条通道,把这条漫长的道路化成一个一个具体的、可分解的、可操作的、可改进的技术性步骤。
二 新方法概说
本节的小题是“新方法概说”,而不是“新视野概说”,原因就在于“科学就是科学方法”(邦迪)。方法、工具的改进往往带来本体论,认识论的根本改观,也带来材料和对象的拓展。也就是说,新视野是新方法带来的。例如,自从伽利略发明了望远镜,天文学的视野彻底改观,原来黑蒙蒙一团混沌的夜空,现在全是材料和对象了。历史音系学已经从目治时代,经过口耳时代,经过机械、电子时代,到达了数码时代。目治时代是指用眼睛看古书的研究方式;口耳时代是指手工操作记录活语言的宏观粗放时代;机械电子时代是指开始使用仪器设备来辅助人力;到了现在数码时代,高保真数码录音机和计算机语音软件则把历史音系学家武装到了耳目。
有关老方法的回顾请看朱晓农的两篇文章[3,4]。下面谈几种近年来逐渐引进历史音系学的一般性方法:雅各布森提倡的类型学,拉波夫开创的社会语言学,奥哈拉提倡的实验音系学,陆志韦开创的音韵材料的统计处理,以及迪克森提出的聚变裂变理论和接触语言学。
类型学对历史构拟的重要性不言而喻。首先在理论上确立类型学在这方面作用的是雅各布森[5],而在实践上做出突破的是Gamkrelidze & Ivanov[6]。印欧语的构拟早在十九世纪后期就已大体完成,以后只有一些局部改进,如索绪尔关于两个喉音的构拟。Gamkrelidze & Ivanov利用Amenian语的材料提出“喉化理论”,用喷音(ejective)取代浊送气音,全面修正格林定律,使得历史语言学取得一个突破性进展。近年来我们关于群母音变的研究和重纽四等的构拟[7,8],都以类型学为出发点之一。
拉波夫的社会语言学推翻了语言演变只能在发生后才能观察到的传统观点[9,10]。这是一个革命性的观念改变,因为在变异派社会语言学variationist sociolinguistics之前,流行的是结构主义的观点,如霍克特有个著名的说法:语言演变是无法直接观察到的,只能事后才能察觉[11]444-445。或如马丁内所说:“语音律的实施是盲目的。”[12]5布龙菲尔德坦承:“导致音变的原因我们毫无所知。”[13]385怎么变不知道,为什么变就更不知道了。只有等到语言变化后,记录下变化的结果,把它跟以前的记录相比较,才能看出语言已经变化了。Labov开创的变异派社会语言学,加上王士元的词汇扩散论,使得我们能在现实活语言中来研究语言变化和变化中的语言language change and language in change,并把这研究结果推广到历史语言学中,从而更深刻地理解并解释语言的历史变化。这样一种使用“共时方法”研究语言变化,被认为对我们认识语言变化的机制和动因有巨大影响[14]312,它回答了或正在回答布龙菲尔德、霍克特、马丁内认为不可能的问题。事实上,Chambers认为拉波夫研究变化中的语言可能是“当代语言学中最惊人的单项成就”[1]147。探讨历史上的语言变化,最好的切入点不是去格致尘封的古籍,而是直接观察变化中的语言。后文“数学方法”一节中介绍的“动态语言学”就是从社会语言学和词汇扩散论中发展出来的。
如果说拉波夫的在共时中研究历时是当代语言学中最惊人的单项成就,那么奥哈拉的“实验重现历史”(凡是历史上发生过的音变,都要它在实验室里重现)的宣言便是历来语言学中最激动人心的目标。这是一个崇高的学术理想,它不是梦想,更不是空想,因为现在已经开始有了这样的研究,开始在奔月梦到登月舱之间建立一条通道,并把这条漫长的道路化成一个个具体的、可分解的、可操作的、可改进的技术性步骤。具体的例子可参看朱晓农关于亲密与高调、群母演变、重纽四等构拟、元音链移[7,8,15,16]和古上声的性质(注:朱晓农《证早期上声带假声》,“汉语上古音构拟国际学术研讨会”(International Symposium on Old Chinese Phonology)提交论文、上海,2005年12月。)等研究。
以上几个研究方向都离不开一个统计概念。这涉及到一个本体论问题。科学界一个世纪来经历了从决定论到非决定论(统计概念)的过渡。语言学中,不但在共时研究中需要统计学,历时研究也需要,尤其在处理大数量的历史音韵材料时要是离开了统计,其结果就是,要么不做什么结论,要么结论言不及义。要说汉语音韵学跟其他语言的音韵学相比有什么特点,那么具备大数量的不表音的音韵材料就是最突出的一个。因此,如何处理这些当年并非为音韵学准备的现在的音韵学材料便是音韵学中“具有中国特色”的任务。这项工作六十年前由陆志韦开创,近年来已有扎实进步[17,18]。后文将介绍两个如何在共时动态研究(沈钟伟)和历史材料处理(朱晓农)中使用数学方法的例子。
近年来出现了一个“聚变—裂变”(equilibrium-punctuation)语言演变模型[19],那是我的一位老师鲍伯·迪克森Bob Dixon提出的。鲍伯是当代头号描写语言学家和数一数二的类型学家,我曾跟他学习调查太平洋岛上的一个施格语[20]。他还是一等一的历史语言学高手。1997年他出版了一本篇幅不大的书:《语言兴衰论》(The Rise and Fall of Languages),提出了一种新的“间或打断的稳态聚合演变模型”。这个新理论融合了两种传统的语言演变理论:反映裂变的谱系树模式(the family tree model)和反映聚变的波浪理论(the wave theory),充分考虑到语言在过去十万年的演变过程中的种种可能,为语言演变以及语言关系的研究展开了新的一页。迪克森从“语言宇观”的角度出发,讲述了澳洲、非洲、南美洲等地的土著语言如何在漫长的聚变期中演化为语言区域(linguistic area),之后又怎么裂变为不同的语言。“聚变”、“裂变”交替进行,构成一幅更为丰富也更为真实的语言演变图景(详见后文)。
具体讨论起来,音韵学中的方法论还有不少盲点,如证据的权重问题,构拟的兼容性问题,是“摆材料、讲逻辑”不是“摆事实、讲道理”,等等。这些问题以前没有注意过,但都具有极重要的意义(详细讨论另外为文)。下面分科介绍实验语音学、类型学和数学方法应用于历史音系学,以及迪克森的“聚变裂变”语言演变模型。
三 实验语音学取向
3.1概说 实验语音学在历史音系学中的作用不言而喻,这一方面是由于语音学取得了巨大进步,另一方面则归功于奥哈拉多年来不懈的身体力行。
历史音系学以认识语音演变——其机制和模式——为主要目标。研究语音演变有两个侧重点:一是注重内部音变,一是注重外部音变。外部音变是指由语言接触引起的音变。内部音变的原因有很多,现在能辨认出来的比较大的原因有三种:一种是比较抽象的“目的论”原理,如省力原理、区别原理、由结构压力造成的填空档等。第二种是本语言社团内部的社会文化驱动因素。第三种是服从生理、物理和/或听感的普遍因素引起的普遍音变现象,这是目前“实验历史音系学”所赋予最大关注的。这种普遍音变现象就会:(1)在历史上重复发生;(2)在其他语言中重复出现;(3)在语言习得中重现;(4)在失语症中镜像重现;(5)在实验室中重现。因此,实验历史音系学就有条构拟原则:所构拟的古音演变要经得起上述五个“重现”的检验。这也符合前辈音韵学家开创这门“口耳之学”的初衷。可以说,这五个重现是把口耳之学具体化、科学化了。
利用实验语音学来探讨历史音韵问题,不但能解决以前解决不了的问题,更重要的是能提出以前没法提出甚至没法想到的问题,例如小称调的来源、形成、发展的问题,不是传统音韵学的研究对象,因为在传统的音韵训诂典籍中没见过有关小称调的记载。又如汉语上~中古过渡期的首次元音大转移和早期上声的语音性质的问题[16,17],如果没有实验语音学,这些问题不要说无法研究,连提都无法提出来。
3.2元音大转移的原因 音变的过程,尤其是原因,一直是历史语言学的中心论题。但直到实验语音学介入之前,我们只能很笼统地用些大原则来解释。本项实验音系学的研究以实验语音学、类型学等为工具来探讨音变的具体过程和特定原因:发现了“汉语元音大转移”,并提出“舌位复初论”加以解释[21]。
汉语历史上首次长元音推链式高化大转移发生的时间上限在西晋以后,下限在北朝前期。链移涉及歌鱼侯幽四部,鱼侯依次高化,逼迫幽部裂化出位::
长元音高化 出位
ai a o/io/iγ u/iu
Ou
汉魏晋(上古韵部)歌 鱼 侯
幽
北朝初(中古韵目)
歌
模/虞/鱼侯/尤 豪
首次元音大转移的启动很可能是从单元音的低端*a开始的。一方面推动连串单元音o、u高化,另一方面拉复元音*al来填补空位。长而低的元音a容易高化的原因在于它难以长时间维持大张口、低压舌状态。当a拖长到一定时候,说者会出于“时间错配”,在最后阶段调音器官会自然地回复或滑向最自然、最无标记的混元音这一初始状态。“时间错配”指发音器官在协同发音的时间上没配合好。按说应该发声先停止,然后调音器官回复初始态。但如果发声还没完全停止之前,调音器官先恢复初始态,那么就会产生一个a或a↑滑音的过渡状态。
按照“回复发音初始态”假设,首次元音大转移是由鱼部*a开始的,由于a向初始态滑动而不经意间开始了高化a↑,并推动o高化。与此同时,由于留下一个纯a位置,吸引歌部*ai来填补——因而这是推链和拉链交叉进行的链移。当然一开始这只是个人的、随机的、口语中的变异,通常会被社会规范纠正,或者被听者自动回归译码为a,所以一般不会发生音变。但是在两种情况下有可能导致音变。一是完全的随机选择。另一是在人口流动、混杂的情况下,非本语言社团的听者不会自动回归解码为说者心目中的语言目标a,当他们学说时,有可能真的说成提高了点的a↑。
这个“复初论”解释能力很强,不但能解释汉语,也能解释在其他很多语言(如日耳曼语支包括英语、汉藏系的白语)中发生的元音高化链移;不但能解释通语,还能解释发生在各方言(例如吴语、客家话)中的链移;不但能解释汉语首次链移,也能解释以后的几次链移;不但能解释高化链移,还能解释其他音变现象如“高元音后显复化”;更重要的是它能解释为什么链式高化的总是长元音而不是短元音。总之,元音高化链移是一种普遍现象,它在各种语言的各个时期,甚至同一个语言的不同时期不断地重现,因此,需要也必须要有一个普遍的理论去解释它。
3.3亲密与高调 有关小称变调变韵问题有过很多研究,描写的各种规则、类型相当繁复。我本来没留心过小称问题,直到有一次在一个小型会议上听到四五篇文章谈小称变调,看到有那么多人关注,就跟着想了想。当天晚餐时,突然想到动物行为学中不但跨语言、甚至跨物种的一条原理,“高频声调表示体型小”,一下豁然开朗。从这条原理可以派生出“下属、弱势、屈从、无威胁、讨好、想要对方善待”等含义。与此相反,低调首先与“大个儿发声者”相关,其次是“统领、侵犯性、有威胁”等派生含义。汉语各方言中形形色色的小称调以及众多看似互不相关的高调现象,如“女国音”、台湾“美眉”、“好好儿的”变调等等,都可以此来做统一的解释。
汉语各方言,包括吴、闽、粤、客、赣、徽、官、晋、粤北土话等等都存在小称调,都可以用高调亲密论来解释。小称调来源于儿语。小称调从发生上说先有昵称功能,再有表小功能;从演化上看昵称功能先磨损,导致小称退化。所以“小称”diminutive应该叫“昵称”affective。小称调有多种形式(高升、高平、超高调、喉塞尾、嘎裂声、甚至假声)和不同功用(从亲密到轻蔑)。这些发声态各异的多种小称调形式是独立发生的,不代表发展阶段,不过产生的原因和所起的作用都是为了突显或强化高调。儿化小称和高调化小称是独立产物,但两者产生的理据都是出于由怜爱婴儿所产生的联想。儿化取词汇义,而高调化则利用了高调与婴儿语音之间的天然象征关系。婴儿的语音则能引起人们对弱小对象的怜爱和亲近。女性的声音也属于高调,通常也给人弱小和怜爱的感觉。
不仅在汉语中,在所有的人类语言中,小称都与亲密、儿语相关。Jurafsky建立过一个小称模型[22]。在各种语言中,小称均起源于与儿童相关的词语,并且高调与亲密相关。在生物学上,任何物种都有爱护保护幼儿的天性。北方话中的儿化现象中的“儿”直接取自“儿”的词汇意义,儿化韵表示“小”、“可爱”也还是与儿童有关。因此,无论是儿化还是高调亲密理论可以得到更为基础的生物行为学的支持。
与此相反的是低沉的嗓音,它给人的感觉则是雄浑厚重,象征的是力量。听感实验表明,嗓音低沉给人的整体感觉是更有自信心,更有统领感[23]。Morton发现,不管哺乳动物还是鸟类,在它们打架争斗时,往往有自信的强的一方发出的叫声、吼声都是低沉的,而弱的一方往往声音尖细,也就是频率高但音强小[24]。因为个头大的声带一般也长而厚,嗓音也就比较低沉。因此,打架前低沉的叫声是为了显示自己个头大,哪怕是虚张声势。与此相反,声调尖细就表示个头小,没威胁性。Ewer认为这是模仿婴儿尖细的哭叫声[25]。奥哈拉认为如果这个假设能够成立,则可以解释尖细嗓音是个摆脱受攻击的好办法,因为在一般的社会中都有避免伤害婴儿的禁忌[26]。
在某些方言中,小称也有轻蔑、鄙弃、调侃、揶揄、藐视、嘲笑的意味,如粤语广州话、信宜话、容县话,吴语温州话、宁波话,徽语屯溪话、黟县话。小称同时具有亲密和轻蔑的含义在世界上其他有小称的语言中也可发现,例如Wierzbicka认为波兰语中从“小/儿”发展出来的隐喻是构成小称的亲密和轻蔑两种含义的基础[28]。如何解释这种现象?这实际上是高调的“本义”——细小、臣服、讨好、亲近——中发展出来的,跟叫人“儿子、孙子、小鬼、小家伙”等一个道理,用在后辈亲近者身上是亲昵,用在朋友身上是揶揄玩笑,用出了范围则轻蔑嘲弄小看他人了。
除了各类小称调,高调亲密论还成功地解释了一些原来很难解释的现象。例如:北京话中的“好好儿”为什么不遵守通常的上声连读变调的规则,而变成了“低高型”;为什么称小孩儿“宝宝”也不是通常的上声连读,也是低高型;为什么台湾国语中把原来属于去声的“妹妹”说成低高型的“美眉”;为什么香港女性的中英文名字爱带i音;为什么北京女孩儿说“女国音”;为什么汉语中指称亲属的称呼大都是上声;为什么有时候陈述语气却用疑问句的语调;甚至为什么男人谈恋爱的时候声音变得尖细起来;等等。所有这一切,都可以通过高调亲密论得到统一的解释。
3.4早期上声带假声 朱晓农以实验语音学的知识来释读古籍中有关声调描写的记载,提出早期上声带假声的观点,并证之以侗语和吴语的声学材料(注:朱晓农《证早期上声带假声》,“汉语上古音构拟国际学术研讨会”(International Symposium on Old Chinese Phonology)提交论文,上海,2005年12月。)。“早期”指的是“四声时代”,大体上从东晋末至初唐两百多年。早期四声调形如《元和韵谱》所描绘的:“平声者哀而安,上声者厉而举,去声者清而远,入声者直而促。”声调是从非声调因素发展而来,这些非声调因素包括四大语音学候选者(时长、音强、音段、发声),十二个具体因素,见下图:
从实验语音学的知识可以一项一项地排除,直到剩下假声和喉塞尾这两个可能造成“厉而举”调形的因素。从田野调查我们发现了两种“厉而举”的调形:高坝侗语的“厉而举”声调是假声引起的陡升高平调,温州话的“厉而举”声调是假声加喉塞尾引起的高急升调,见下图。这两位都是男性发音人,他们“厉而举”的声调都极高,阳调几达300赫,阴调更高达340-360赫兹,这对于女性来说都是很高的。
竖轴是赫兹,横轴是毫秒。【左】高坝侗语的五个平调的平均基频曲线,最高的平调带假声。【右】温州带假声和喉塞尾的急升的阴上和阳上,以及另三个作为参照的声调。
有四项材料都表明早期上声是温州型的:平仄的长短含义、平仄的“隐形特征”、王梵志的诗韵格式和梵汉对音[28-30]。早期声调的时长格局与顾炎武的推测相仿:“平音最长,上去次之,入则诎然而止。”(《音学五书·音论卷中·古人四声一贯》)
四 类型学取向
4.1引言 对语音类型的关注很早就开始了,赵元任在1930年代对汉语中的爆发音种类的探索[31],可以说是最早的一项系统的专题语音类型研究。不过,直到格林堡于1950年代把眼光投向非洲、美洲语言,世界范围的语音的分布才第一次整体地呈现在语言学家面前。格林堡的《人类语言的共性》和麦迪森的《语音格局》开阔了历史语言学的视野[32,33]。
研究语音类型和共性本身不是目的。它就像“基本国情调查”,全国有多少人口、分布密度、男女比例、年龄构成、民族成分、教育程度、收入分配,如此这般,等等等等。了解了这些分布类型,就可以探讨形成的原因,或作为制定各项政策的依据等。语音类型研究同样是醉翁之意不在酒,同样是墙里开花墙外香。今天的分布是昨天演变的结果。因此,如果分布有什么规律可言,那就一定服从演变的规律。因而共时的分布模式就为追踪历时演变提供了线索。它的成功大大刺激、推动了对语音现状的历史来源和广义物理原因的探讨,也因此大大推进了我们对语言的理解。从这个意义上来说,就可以不分墙里墙外了。没有语音类型学之前,对语言来历和原因的探讨始终是零星而不系统的、猜测性较多的、缺乏稳定动力的。语音类型学建立之后,历史语言学家和理论语言学家突然发现了问题来源的宝库。他们可以系统地制定目标推进研究了。
雅各布森在1950年代以语音类型和共性为出发点做过两项经典研究:一项是对共性的功能解释,一项是类型学对历时研究的贡献。前者就是直至今日依然常有人提起的“为什么都叫‘爸爸妈妈?’”[34],后者则是为历史语言学指点了一条新路向的“类型学研究及其对历史比较语言学的贡献”[5]。日后Gamkrelidze & Ivannov重塑印欧历史语言学即以此为发轫[6]。
4.2“古无轻唇音”的证明 钱大昕《十驾斋养新录》中有个名篇“古无轻唇音”。他一开始就给出这个结论,然后堆砌一百多个例子一直到底。“古无轻唇音”的观点可能不朽,但钱氏的论证不符合现代科学的(演绎)逻辑程序。实际上,他没有进行论证,他所提供的材料能说明的只是“轻重唇古同类”。因此前些年有人提出相反意见“古无重唇音”。双方都说出一个逻辑可能性,从逻辑角度看,谁也没比谁好。其实,还存在第三个可能性:“古无唇音”,即轻重唇音都来自非唇音。那么,如果没有直接证据,该怎么来论证呢?可以——
(1)从语音学角度,从重唇变轻唇是语音学上常见的“弱化”,反之少见。
(2)从简明性角度,在构拟历史音变时,如有多种可能,除非另有证据,先选择比较简单的,而简单的也跟下面第3点要说的概率高的相关[8]。
(3)从共性角度:共时的分布类型,或历时的演变方式。本节内我们来看从共时分布类型怎么论证。下图和下表是唇音在317个语言样本中分布情况[33],P=重唇音p/ph/b,F=轻唇音f/v。
因统计频数较大,可近似看作概率。猜上古有唇音,
蒙对的概率:308/317=0.972 蒙错的概率:1-0.972=0.028
如果上古只有一套唇音:(1)有重唇而无轻唇,或(2)有轻唇而无重唇,那么,
蒙(1)蒙对的概率为:173/(173+23)=0.883 蒙(2)蒙对的概率为:23/196=0.117
以上从共时分布来看,“古无轻唇音”的可能性为0.858(=0.972*0.883),而“古无重唇音”的可能性为 0.114(=0.972*0.117),“古无唇音”的可能仅为0.028。从历时演变来看,从重唇变轻唇音很常见,例如格林定律所指的日耳曼语的辅音链式音变就包括重唇变轻唇这一环,反之则罕见。
钱大昕找到100多个例子得出“古无轻唇音”的“不刊之论”。材料不少,却成问题。他把不同时间、不同地域的谐声、假借、直音、读若等性质不一的材料往那一堆了之。细究起来,只有直音、读若等直接指明同音的材料才能证明古同类,谐声、假借的材料并不是逻辑上充分的证据。甚至连直音材料都不一定如山铁证。例如从这么样一条记载“蛋黄,上海话音荒”,能证明上海话浊音清化了吗?当然不能,因为有可能:(1)方言混杂;(2)古音遗留;(3)个人怪僻;(4)条件音变;(5)个别例外;(6)音变开始;(7)浊音已经清化;(8)清音变成了浊音,别以为这不可能;(9)其他可能的情况。这还只是材料问题,说到论证,问题就更严重了。演绎逻辑钱大昕那时代还没有。就归纳来说,他也得不出这个结论,因为固然有可能古无轻唇音,但也可能古无重唇音,甚至还可能古无唇音。从那些材料能概括的只是轻重唇古同类。钱大昕实际上还无意识地依赖了别的方法和前提,这种无意识,说不出所以然,是不是就是“蒙”?“蒙”在研究的第一阶段(随机探索)是可用的,它的现代定义就是用归纳、类推等联想方法猜出逻辑可能性之一。而证明是用演绎法指出逻辑必然性。我们现在做历史音系学,比起钱大昕来,“蒙”还是在“蒙”,但有几点改进了。第一,考虑到各种逻辑上的可能性,也就是说不瞎蒙了;第二,使用实验语音学,这保证我们的“蒙”从生理、声学方面来看是合理的,进一步不瞎蒙了;第三,使用类型学,这引导我们从最大概率角度去“蒙”,也就是说去“蒙”最大的逻辑可能性,蒙对的机会大增。因此,我们现在的“蒙”尽管还不能一定得到逻辑上必然的结果,但至少开创了逼近逻辑必然性的道路,也就是告别了历来的摸着大象瞎蒙,走上了理性之路。
4.3浊爆音的分布和群母的命运群母是个不合群的声母,从很早起它就缺了点什么。其他爆发音声母(并定见溪)都是四等俱全,群母却只有三等字。对群母的分布空缺,很多学者从历史发展、现代方言里的残留读音以及域外对音等多方面来证明上古群母也是四等俱全的(详见[7])。那么,为什么上古以后其他爆发音阻塞依旧,群母却破塞为擦了?难道群母命中注定要先变?
研究这个问题的一个合适的出发点便是类型学。如果我们发现软颚浊爆音在世界语言中的分布常常出缺,那么群母的问题就不单单关乎群母,而是一个普遍的、类型学上的问题。如果这是一个普遍的问题,那么就一定有普遍的原理在控制,我们就应该去探求这个广义的物理原因。综观世界语言,浊爆音中软颚音最容易出缺,例如欧洲的荷兰语、捷克语,亚洲的泰语,美洲的Hixkaryana等都是有[b,d],但没有 [g]。下面表中是[b,d,g]的在317种语言中的分布数据[33]:
有212种语言有至少一个浊塞音,有[b]的语言最多(202),比[g](180)多12%。从分布来看,绝大部分场合都是有[g]就有[b/d],没[b/d]就没[g]。真正不合这项分布的,即有[g]但[b,d]都没有,这种例外只有4次,不到2%。可见群母的分布缺等是常态。而隐藏在这种分布不平衡后面的原因就在于空气动力学的原理。赵元任很早就用通俗的语言指出了这个道理[31]:
这里的理由不难找,从舌根与软腭相接的地方到声门那里一共就没有多大的空间可以像口腔较宽绰的[b]或[d]音那么弄出些特别的把戏;声带稍微一颤动,那一点的空间马上就充满了气成正压力了。所以也没有空间也没有时间可以造成第九类那种悬挂的印象或是第十类那种望里“爆发”的印象。本来舌根的爆发音不加上那些特别的把戏已经够难成浊音了。
浊塞音难以维持的原因在于空气动力学的偏见[7,35]。但有趣的是为什么群母的洪音字变了[g>γ],而在三等细音字里还保留着呢?像“群奇琴强”等有[i]介音的细音字在《切韵》时代还是群母[g]。为什么中古群母还有、且仅有三等字?原因还是可以从赵元任的那段话里引申出来。[g]容易消失是因为“从舌根与软腭相接的地方到声门那里一共就没有多大的空间”,而发[b,d]时“口腔较宽绰”。现在[g]后面有了个颚介音[i],成阻点往前了,也就是说,这个/g/其实不是软颚音,而是硬颚音。这样一来,“口腔较宽绰”了,浊声也就容易持续了,所以“群琴期”等字的[g]暂时保留下来了。由此可见,成阻点越往前,口腔空间越大,就越能够抗拒清化。因此,浊塞音消失是从成阻点在后的开始的:小舌塞音[G]最早,然后软腭塞音[g],然后硬腭塞音,最后是齿音[d]和唇音[b]。
五数学方法
语言学各领域中是音韵学首先引入数学方法。前辈学者几十年前就使用了统计的方法,如白涤洲、罗常培、赵元任等等。尤其是陆志韦,引进了当时较为先进的概率论。可见,数学方法的运用不是一种尝新,更不是一种时髦的选择,它可以使思维精密化,筛去由含混造成的干扰。下面介绍两项研究,一是对共时动态的语言变化建立数学模型,一是对历史音韵材料进行数学处理。
5.1动态语言学的数学模型:沈钟伟 沈钟伟提出了一个描写语言动态变化的数学模型[36,37]。他认为研究语音变化的动态过程是认识音变原理的关键,不然关于音变的讨论无法深入。音变可以看作是一种语言“传染病”,可以和医学上的传染病的传播过程相比较,两者的传播媒体都是人。已经发生了音变的人可以类比于受病毒感染的,而未发生音变的人是未受感染的。音变则是一个“语言病毒”传播的过程。
王士元的词汇扩散理论中一个重要推理是:一个音变中在语音和词汇上不可能都出现“突变”,因为这样的音变就成了一种顷刻间的变化。但这是个人的语言情况。如果加入人群(语言社团)这个向量,个人语音和词汇上的突变,就不和整个音变的渐变性产生矛盾。
某个人语音 某个人词汇 人群
突变 突变 渐变
任何语言变化的实质都是一个新的语言要素在一个语言社团中的传播。一个语音变化,不管是从一个语音条件向另一个语音条件扩散,或者从某些词汇向另一些词汇扩散,总是要在使用这一语言的人群中传播来进行。
如果语言变化是可以观察到的,那么音变的动态过程是可以研究的。沈钟伟一方面做了大量的个体调查,因为取样越大,越能精确地代表语言社团的语言实际情况。这不但是一个统计上的基本要求,更在理论的逻辑推理上避免受到有限材料的影响而产生误解。另一方面他又运用数学模型来做分析研究。运用数学模型既便于对大量的数据材料做出量化处理,又能把要了解的现象和要回答的问题用精确的方式表达出来。
一个语言社团中的任何一个人在某个词上的音变只有两种表现方式,“未变”的和“已变”的。在任何一个时间(t),“未变”(u)和“已变”(c)的人构成一个语言社团中的人数的总和。换用数学语言表示:
1=ct+ut, 或者 ut=1-ct。
当然,“未变”和“已变”的人的接触并不每次都造成音变的传播。传播有一个效率(a)。随着时间的发展,“已变”人数会逐步增加。“已变”的人数的变化和时间的变化可以用一个微分公式来表示:
△c=auc△t.
这个微分公式的解是
c=(1+ke-a(t-b))-1.
如果c(“已变”的人)是知道的话,这个算式就可以用来求出音变的速率(a)和音变的起始点(b)。
通过对这些材料的综合分析,沈钟伟发现语音的合并过程是“有向而无序”的。有向性可以证明语音在做动态变化,无序性则揭示了音变有规律的根本原因。同时也解释了显示词汇扩散的各种语言材料。
5.2从韵脚重建古韵辙和古韵母:朱晓农 韵脚在音韵学研究中的重要性。历代音韵学有一个核心问题:如伺利用古代韵文材料来重建古代韵母系统。
音韵学如果从宋代吴械、郑庠划分《诗经》韵部(即韵辙)算起,有上千年的历史,做的就是从《诗经》韵脚入手来划分上古韵部。到清初顾炎武这项工作发展成一种系统研究。有清一代古音学,这几乎就是音韵学的全部。至民初高本汉带来历史语言学,音韵学的广度和深度都拓展了不少,但利用韵文来划分韵辙依然是一项重要工作。如陆志韦、王力依《诗经》韵划分上古韵辙,罗常培、周祖模、丁邦新、李荣、张世禄等进而编撰汉魏晋隋唐宋韵谱以探讨历代韵辙系统。
两个缺陷。上面讲了重要性,但问题在于,尽管历经上千年,尽管有无数杰出音韵学家的努力,探讨这一“千古难题”的方法依然停留在乾嘉水平。一方面,凭经验估计来划分韵辙(韵部),缺乏一个客观标准。 1950年代语言所开了个会,陆志韦、王静如等和作者罗常培、周祖谟一起,猜测他们的两汉韵谱中所用的分部标准(即划分韵辙)是三七开还是多少开。其实就是说三七开,仍有四种理解:1)七成同用(三成独用)即合辙,2)三成同用(七成独用)即合辙(别以为这绝对不可能),3)七成独用(三成同用)即分辙,4)三成独用(七成同用)即分辙。而且,即使说清楚是四种中的哪一种,依然没解决更困难的问题:凭什么是三七开而不是二八开?二点九、七点一开行不行?另一方面,对韵辙(韵部)内部的韵母区别无能为力,例如同一个“言前”辙内部有an、ian、uan、yan四个韵母,这在以前是没法管的。
以前是用“韵段/韵次/韵例”来统计,因此,一首押3个韵脚的诗和一首押30个韵脚的诗,都计算为一次韵例,而他们在统计中的重要性完全不一样。结果造成两个缺点:1)粗糙:没有区别应该区别的情况;2)浪费:无法利用可资利用的信息。
看一个著名的脂微分合问题,这是王力先生在音韵学上的最大贡献之一。但是,一方面他主张脂微分部,另一方面却又说:“如果谈古音者……不把脂微分开,我并不反对”[38]147。他这种犹豫态度表明单靠“考古之功”“文献法”来探求古韵母,到此差不多走到了尽头。找到《诗经》里110例押脂微韵的例子,数清楚其中26处合韵,84处分韵——这就是“文献法”所能做到的部分“知其然”。如果想要全面地“知其然”,想要“知其所以然”,想要确定脂微是完全“同辙同韵”、还是“同辙不同韵”、还是干脆“不同辙”,那是数理统计的工作(参看陆志韦[39]、朱晓农[17,40]、胡杰和尉迟治平[41],、麦耘[18]等)。
解决方案。朱晓农以数理统计方法制定了一套客观标准,解决了这个自宋代以来的千古难题[17,40]。自此以后,在利用古代韵文材料划分韵辙时不必再凭经验来估计,在区分韵辙内部的韵母时有了一套严格的操作程序和数学证明。注意:使用数理统计方法并不跟校勘和系联对立,统计就是对经过严格校勘的韵脚的细心系联结果的统计。
两个基本概念(用作统计):韵次Y,字次Z。两者的关系为Z=2Y。
三个重要数值(用作分韵判断第1步):同用的理论预期值P,同用的实际统计值R,韵离合指数 I=R/P*100。
判断两个韵的分或合,并不仅仅依靠表面上相押的次数或百分比。另外有两个因素在起决定作用:
(1)所有韵的总字次。
(2)每个韵各有多少字,或更精确点,各出现多少字次。总字次对分辙有用。各韵的字次对辙内分韵有用。例如有A、B、C、D四个韵,分辙公式先把他们分成比如说两个辙:A、B甲辙,C、D乙辙。假如统计结果如下:
(3)A独用60次,B独用10次,A~B同用30次。
(4)C独用35次,D也35次,C~D同用30次。
甲乙两辙同用数相同,都是30次;独用数也都是70次。结论似乎应该是若CD合成一韵,AB也该如此;其实不然。因为A、B、C、D四韵的字次可能不同。打个比方,有两个口袋(两个辙),各装100个球(各韵的字),分两种颜色(两个韵)。甲袋里黑球80个,白球20个。乙袋里红绿各50个,假定这些球摸上去手感都一样(两韵无区别),那么每次到一个袋里去摸出两个球(押一次韵)是什么颜色,取决于这种颜色的球在总球数(100)里的比例。因此——
(5)在甲袋里摸100次,每次两个球,黑黑“相押”的机会=64次(=0.8*0.8*100),白白独用机会=4次 (0.2*0.2*100),黑白同用=32次(0.8*0.2*100+0.2*0.8*100)。
(6)在乙袋里摸100次,那么红红相押机会=绿绿相押机会=25次(=0.5*0.5*100)。红绿混押的机会 =50次(=0.5*0.5*100+0.5*0.5*100)。
上面(5)、(6)是理论预期值,(3)、(4)是实际统计值。两两分别相比,就可看到:
上面(3)里面的同用实测数(30次)和(5)理论预期(32次)差不多相等,离合指数I=94(=30/32*100),统计推断是A、B两韵浑然无别。
但是,(4)和(6)的情况很不一样,理论预期C~D相押应该有50次,而实测结果只有30次,大大低于预测,离合指数I=60(=30/50*100)。意即,说C、D是否已经合韵并没什么把握。因此还需要进行一次——
t分布假设检验t-test(用作分韵判断第2步),来决定C~D是否合成一韵。有关公式和具体计算步骤可参看文献[17]和[40]。
六 聚变裂变论
“聚变-裂变”(equilibrium-punctuation)模型,或“间或打断的稳态聚合演变模型”the punctuated equilibrium model,是迪克森在《语言兴衰论》[19]一书中提出来的。这是他从生物学里借来的术语(最早见于 Eldredge & Gould[42])。生物学里“punctuation”意译、“equilibrium”直译为“间断(突变)平衡模型”。我“punctuation”直译、“equilibrium”意译给他起个意思更为显豁的语言学名字“聚变-裂变模型”。Punctuation是“中断中裂”的意思,我把他直译为“裂变”。Equilibrium是“平衡稳定”的意思,此处指多种语言/方言聚集在同一地区,互相接触,不同的语言特征聚合互动、互相影响,经过一段很长的时期,最后达到一种稳态平衡的状态,逐渐形成区域特征,并成为后世共同的原型。用迪克森自己的话说就是:“linguistic features diffused across the languages in a given area so that-over a very long period-they gradually converged on a common prototype”[19]4。对照“裂变”,并参照他用以解释这模型的“converge”(汇聚、集中)一词,我把达至稳态平衡的语言特征在区域内传播意译为“聚变”——地理上多个语言/方言聚集在一起,语言特征上相互汇聚导致最终产生一个共同原型。迪克森的基本观点是:谱系树模型仅适用于裂变期,而不适用于聚变期[20]5,30。十多万年来的语言演变,大部分时间处于聚变期,裂变仅仅是偶尔发生。也就是说,语言变化总体上是以趋向区域平衡的聚变为主,只有当大规模的移民潮发生,才涉及中断式的分化裂变疾变激变。迪克森认为当前语言学家、考古学家和遗传学家所持观点有很多需要重新考虑。他还强调说:构拟方法能适用的范围很有限,而现有的关于祖语可以重建的猜想应该摒弃。我把他的观点稍事折中一下,“聚裂论”可以看成是一个更为普遍的语言演变模型,他把谱系树模型包容在内,让他作为一个说明特定时期变化的特定理论,而历史语言学家现在的任务是要更多地去关注过去忽视了的那种达至稳态平衡的聚合变化。
运用“聚变裂变”理论来看汉语方言,一些过去难解的系属问题突然开朗起来。像粤北土话、湘南土话、徽语以及平话等等,这些在谱系树模型中找不到合适节点的小方言群,很可能就是区域聚变的结果。粤北土话是个典型,按照郭必之的研究,这个小方言群是由粤语、湘语、客家话,可能还有民族语的来源聚变而成[43]。由于长期处于一个比较封闭的地区,说不同方言/语言的族群无可避免地互相影响。这些族群之中,没有任何一支在文化或政治上具有特别的优势。为了生活上的方便,当地居民多多少少都掌握一点周边的方言。因而造成各种语言特征在区域内扩散、磨合。粤北土话有以下几项共同的语音特征:
a)缺乏塞音韵尾,来源语都有塞音韵尾。
b)鼻化韵丰富,而粤北地区的客语和粤语都没有鼻化韵。
c)后元音相当丰富,如雄州话有、u的对立;长乐话则有u、、ou等韵母。
d)普遍存在小称调,部分方言更有一种“嘎裂声”的小称调现象。如韶关城关一位老年发音人“篮”。详见朱晓龙[44]庄初生(注:庄初升《粤北土话的小称变音》,第11届International Association of Chinese Linguistics会议论文,日本爱知大学,2002年。)。
如果这些方言相处的时间更久一点,而社会环境又维持在1950年代以前的状况的话,各方言之间的借用可能会更加厉害,彼此会变得越来越像,最终发展出一个共同原型(common prototype),而这正是“聚变期”的一大标志。可是,最近半个世纪来,随着交通的发达、媒体的普及和普通话的推广,粤北土话呈现出急速没落之势。韶关市区的居民在1950年前还是以说土话为主,但今天的韶关话已经和广州话没有两样了。这是新一轮的接触演变,目前还在进行中。照此以往,粤北土话在两三代内可能会消亡,只剩下某些音和词以底层形式遗留下来。
“聚变裂变论”的出现,补充了历史语言学中谱系树演变模式的不足,使得汉语方言分区中的一些症结得到了理论上的阐述。一些处于大方言交界处的小方言群,过去在传统框架中无所适从,系属难明,其实都可能是区域聚变的结果。
七 历史音系学的基本假设:结语
在上述实验语音学、社会语言学、类型学、接触语言学和数学等方法引进历史音系学之前,除非有足够密度的、详尽清晰的历代记载,否则构拟演变在很大程度上带有不确定性,至少不是必然性的。我们之所以能在历史音系学中引进这些普遍的方法,是基于一个对语言演变最基本的假设:时空的“齐一性”原则(uniformitarianism)。这条科学中的基本假设说的是:人的发音、听感的生理基础都是一样的,语音传播的物理性质更是毫无二致,所以,此时此地能出现的语言变化,彼时彼地也能出现;此时此地难以出现的情况,彼时彼地也难。换句话说,对于语言自然演变的有利条件和限制条件,古今中外都是一样的。人同此口,音同此理。只有承认了这条齐一性原则,历史语言学才有建立的可能。我们才能“以今律古”,用已知推未知,以今人之口度古人之音,从今天的语言知识倒推回去,重建古音。齐一性原则是一切科学学科中的基本假设。一条物理定律如果在黄河适用,那么在银河也适用;如果今日适用,那么在大爆炸之初也适用。承认了这条原理,才有可能把语言学建立在坚实的科学基础之上,既不仅仅停留在文献搜索的史学阶段,也不刻意追求什么地方特色。