根据古代语音的分类,用定量分析的方法将汉语方言划分为汉语方言_方言论文

在古音类的基础上用定量分析法区划汉语方言,本文主要内容关键词为:古音论文,汉语论文,基础上论文,区划论文,定量论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

《中国语文》1988年第二期发表了郑锦全先生的《汉语方言亲疏关系的计量研究》一文。郑先生以北京大学1962年版的《汉语方音字汇》为材料,统计了十七个方言点音韵上的亲疏关系。各方言声母和韵母的异同,郑先生是通过比较具体音值(即音标)来确定的。但是,具体音值表面的相同未必是真正的相同,表面的不同未必是真正的不同。用严式标音的话,同一个“P”声母,上海话是[P-],北京话是;同一个“P′”声母,北京话是[P[h]-],南昌话是,太原话是[PX-];同一个“b”声母,上海话是[ph-],宁波话是,松江话是['b-],文昌话是[?b-]。事实上,人们在记音的时候,对没有辨义作用的细微差别是不太在意的;归纳音位,为了突出音位差异,常会对标音符号作一些处理。如上文列举的例子外,还会把等等。就一个音系来说,只要不出现音位上的混乱,一个音记得严一些,宽一些;开一些,闭一些没有多大的关系,但涉及音系间的比较,就直接关系到是否相同或相异的问题。脱离具体音系直接比较各方言的音值,音值的同一性问题也许是难以克服的障碍。郑先生的统计结果同一般对汉语方言分区的认识有较大的距离,这也许是一个重要的原因。①

本文尝试换一个角度,以古音类为标准,用统计的方法,对汉语各方言的声类、韵类和调类进行全面比较。这个作为标准的古音类以《切韵》音系为基础,但不是说现代汉语方言都是直接从《切韵》音系演变来的,而是把《切韵》音系当作比较的参照系。

1、我们以北京大学中文系语言学教研室编的《汉语方音字汇增订稿》②(下文简称《增订稿》)为基本材料,假设《增订稿》所收的二十个方言点是汉语方言的代表点;《增订稿》所收的常用字可以概括这二十个方言点语音系统的概貌。

1.1《增订稿》所收常用汉字二千九百六十二个,为使比较有据可依,删除了没标明音韵地位的汉字四十七个,实际统计的有效字是二千九百十五个。

《增订稿》一个字有文白两读,北京取文读音,其他地点取白读音;一个字有几读,取第一读音。一字一音,使各方言在统计总量上一致。如:

“雾”字,长沙有两个读音,取第一读音[mei]。

1.2汉语大多数方言的韵母一般都可以用开齐合撮四呼来归纳。相当多的方言,开口呼零声母字在韵母前往往带有一个喉塞音,齐合撮三呼零声母字在韵母前带有一个摩擦成分,严式标音可以分别记为[ji-]、[wu-/vu-]、[Y-]、由于它们没有辨义作用,一般都处理为零声母。鉴于这种认识,我们对《增订稿》的声母韵母作了一些调整,以便使比较材料尽可能一致。

①删掉苏州话和温州话的“h”和“j”两个声母。

②删掉广州话和阳江话的“j”和“W”两个声母③,把[i]、[i-]和[Y]、[Y-]前的“j”直接去掉,把其他元音前的“j”改为介音[i-],把[u]、[u-]前的“W”直接去掉,把其他元音前的“W”改为介音[U-]。

③删掉太原话和梅县话的“V”声母,把出现在[u]前面的“V”直接去掉,把出现在其他元音前的“V”改为介音[u-]。

1.3辅音独立成音节。根据来源,成音节的辅音来自古声母,就作声母处理,同时在韵母的空位上设立零韵母。成音节的辅音来自古韵母,就作韵母处理,在声母的空位上算有一个零声母。如:

本文把《增订稿》上的二千九百十五个字的每一个都看作是声韵调三者的结合体。

2、古音类的确定。为了避免主观随意性,最好对《切韵》声系的声韵调不作任何更动,以它为标准,直接用于各方言间的比较,但汉语方言的客观现实告诉我们,这样做未必理想。如《切韵》二百零六韵,不算声调平上去的差别,也有九十多个,这些韵在各方言的分合归并,情况极其复杂,用它来比较各方言韵类的异同,势必把一切搞得支离破碎。可见古音类的范围以大为宜。古音类定得大,对统计也有好处。例如我们把声类定为二十二类,韵类定为十九类,调类定为八类,在声韵调的综合统计时,就可以在一定程度上改变以往统计大大压低声母韵母的作用而过分突出声调作用的状况。④当然古音类定得大,可能会掩盖许多细节,不过任何抽象都是以牺牲个别为代价的,我们的目的是划分大方言区,划分大方言区自然不可能顾及各方言的每个细节。

2.1古声类。声类受发音部位和发音方法的双重制约。如果说传统七音主要是以发音部位来分类的,全清、次清、全浊和次浊是以发音方法来分类的,那么无论从七音出发,还是按清浊分类都会失于偏颇。我们采用的方法是以传统七音为基础,再作若干调整,然后把其中的全浊声母按类提出来另列。古声类总共分为二十二类,它们同《切韵》三十六母的关系如下:

(1)帮类—一帮、滂

(2)端类—一端、透

(3)知类—一知、彻

(4)精类—一精、清、心

(5)庄类—一庄、初、生

(6)章类—一章、昌、书

(7)见类—一见、溪

(8)影类—一影、喻

(9)晓类—一晓

(10)来类—一来

(11)日类—一日

(12)明类—一明

(13)泥类—一泥

(14)疑类—一疑

(15)并类—一并

(16)定类—一定

(17)澄类—一澄

(18)从类—一从、邪

(19)崇类—一崇、俟

(20)船类—一船、禅

(21)群类—一群

(22)匣类—一匣

2.2古韵类。古韵类按《切韵》二百零六韵分类显得繁复,按阴声韵、阳声韵、入声韵分类,又嫌太粗。现按十六摄分类。以塞音收尾的入声韵和以鼻音收尾的阳声韵差别较大,我们把入声韵从阳声韵里抽出来,按韵尾的不同再分三类,来自深摄、咸摄的为咸入类,来自臻摄、山摄的为山入类,来自宕摄、梗摄、曾摄、通摄和江摄的为通入类。古韵类总共分为十九类。韵摄的分合,着眼于韵尾和韵腹的异同。分类不考虑韵头似乎是个不足,但传统写诗押韵,习惯只注意韵腹和韵尾,而不管韵头;各方言介音的有无和归属(归声母还是归韵母)常常是争论的热门话题,说明韵头不象韵腹和韵尾那样容易被人感知,也说明韵头不如韵腹和韵尾那样重要。

2.3古调类。《切韵》的调类是平上去入四个,现代方言调类有少到三四个的,也有多到八九个甚至十个的。调类的演变规律性强,都是在四声基础上阴阳的分合归并。有的方言有八个以上的调类,一般是在入声分阴阳两调的基础上再分调,可以把它们归入相应的阴入或阳入中去。本文的调类定为八类,即阴平、阳平、阴上、阳上、阴去、阳去、阴入、阳入。

3、统计上的一些处理。要统计的音类总个数是二千九百十五个字。各音类在音系中的地位以拥有字数的多少来决定,字数多的音类在音系中的地位就重要,字数少的音类在音系中的地位就相应减弱。音类的重要性除了字数的多少外,照理还应考虑字的使用频率。使用频率目前还没条件统计,只好暂时不予考虑。

3.1在《切韵》音系基础上制定的古音类同现代方言的音类往往不是一一对应的,而是一对几,或几对一的关系。我们以古音类为参照系,把现代各方言的音类一一和它比较,现代方言几类音正好和一个古音类相合,它们所拥有的字都以“合类字”统计;现代方言的一类音横跨几个古音类,以占某古音类字数最多的类,统计合类字,分布在其他几个古音类的字以“出类字”统计;现代方言的一类音在两个古音类占据相同的字数,则根据情况酌情处理(这种情况很少出现)。如:

音系 韵类 字数韵类 字数

切韵 效类 209 流类

147

北 au

120 au 4

iau88 iau 1

ua 1

u 9

ou77

京 iou

56

古效类和北京话的au和iau类大体相当,从古效类来说,北京话只有一个ua类字出类,从au和iau类来看,只有五个字混入古流类,因此,北京话在古效类的合类字是二百零八个,出类字一个。古流类和北京话的ou和iou类大体相当,从古流类来说,北京话有十四个字出类,从ou和iou类来看,它们只出现在古流类中,因此北京话在古流类的合类字是一百三十三个,出类字十四个。又如:

古宕类、古江类和北京话类重合,在古江类的三类字数量分别少于古宕类中和它们相同的三类字。因此,我们只把北京话在古宕类读三类音的算合类字,在古江类读三类音的都算出类字。北京话古宕类合类字是一百九十一个,古江类出类字十七个。

这样统计的理由是,古音类以《切韵》音系为基础,同一个古音类内部,如果有几类音构成,它们之间的关系就比较密切,而分属不同古音类的几类音,彼此关系相对就疏远一些。语音在历史的长河中发生着变化。现代汉语各方言同《切韵》音系的亲疏远近各不相同,它们演变的速度、方向也不尽相同,但演变总是有规律的,由繁到简是大势。一个方言和《切韵》的关系越密切,古音类的界线就越清楚;越疏远,古音类的界线就越模糊。就是在一个方言内部,各古音类的界线,也是有的清楚,有的模糊。如,北京话au、iau两类音和古效类基本相合,ou、iou两类音和古流类基本相合,说明古效类和古流类在北京话里界线基本是清楚的,这两个古音类还保存得比较完整;北京话的三类音横跨古宕、江两类,说明这两个类在北京话中已没有区别,仅相当于一个古音类。通过合类字和出类字的统计,就可以把一个方言语音的基本面貌显现出来。

3.2下面对声类、韵类和调类的统计再分别作些说明。

3.2.1声类。古全浊声类在现代方言中是保存下来了,还是清化了,这是极其重要的语音特征。我们规定古全浊声类和非全浊声类的界限不容超越,已经清化的古全浊声类字全部算出类字,非古全浊声类字浊读成全浊声类字也算出类字。浊读的古全浊声类字之间的混杂,或非古全浊声类字之间的混杂,孰去孰留,通过比较才能确定,上文的原则,这里仍然适用。例如:

古全浊声类在北京话里已全部清化,定类的一百十七字全算作出类字。古端类在北京话里读t和t′两类,只有一个字读成n类,北京在古端类的合类字是一百四十五个,出类字一个。古泥类在北京话里读n类,北京话n类基本和古泥类对应、合类字是四十七个。苏州话较完整地保留了古全浊声类,古定类合类字是一百十三个,有四个字声母清化算作出类字。苏州话在古端类的读音是t和t′,合类字是一百四十一个,有五个字声母浊化算作出类字。苏州话在古泥类的读音有n、n[,e]、s三种,读“s”的一个字显然是出类字,读n[,e]有十八个字,字数少于古疑类中读n[,e]的字,也只能算出类字,因此苏州话在古泥类的合类字是二十八个,出类字是十九个。

3.2.2韵类。十九个古韵类可以归并成阴声韵、阳声韵和入声韵三大类。阴阳入三分的框架是《切韵》韵类的基本框架。考察现代方言符合古韵类的标志是,阴声韵以元音收尾,阳声韵以鼻音(或鼻化音)收尾,入声韵以塞音收尾。我们规定在古阴声韵、古阳声韵和古入声韵三者之间跨类的字,一律算出类字,在每个大类中韵类之间的跨类字,则通过比较确定取舍。例如:

太原话在古山类中有两类读成阴声韵,它们都算作出类韵,太原话的两类通过比较确认是与古山类相合的韵类。因此,太原话古山类合类字是一百七十六个,出类字是一百三十九个。又如北京话的古入声韵字都读成了阴声韵(个别读成阳声韵),这些字全都算古入声韵的出类字。

3.2.3调类。入声和非入声是重要的语音差别。我们规定,在古入声和非入声之间跨类的字,一律算出类字,在古入声内部或非古入声内部的跨类字的去留则通过比较确定。例如:

音系调类字数调类字数调类字数调类字数

切韵阴平588 阳平581 阴上325 阳上 233

北 阴平576 阳平560 上声312 上声 124

阳平 8 阴平 14 阴平 6 去声 109

去声 4 上声 6 阳平 1

京 去声 1 去声 6

切韵阴去405 阳去311 阴入265 阳入207

北 去声384 去声294

阴平 9 阴平 1

上声 12 阳平 7

京 上声 9

北京话上去两声不分阴阳,按古阴阳两调中占字多的一类统计。因此,北京古阴平合类字是五百七十六个,出类字是十二个;古阳平合类字是五百六十个,出类字是二十一个;古阴上合类字是三百十二个,出类字是十三个;古阳上出类字是二百三十三个;古阴去合类字是三百八十四个,出类字是二十一个;古阳去出类字是三百十一个;古阴入出类字是二百六十五个,古阳入出类字二百零七个。

4.1在统计了二十个方言点的声类、韵类和调类的合类字和出类字,获得大量统计数据的基础上,用计算机统计任意两个方言点之间的接近度。⑤统计的具体项目有,声类接近度的统计、韵类接近度的统计、调类接近度的统计、声类和韵类接近度的综合统计、声类韵类和调类接近度的综合统计等等。计算所使用的数学公式是:

D表示接近度,i和i[,1]分别表示不同的方言点(i≠i[,1]),n表示比较条目的个数,j表示某一比较条目,a(i,j)表示i方言点在j条目的数据,t表示参考总量,即古音类的总个数。接近度值的范围在“1”到“0”之间,绝对值越大,表示接近度越高,绝对值越小,表示接近度越低,绝对值到“1”表示完全相同,数值到“0”表示没有联系。

4.2在取得二十个方言点任意两点接近度的统计数值后,再进一步对这些数值进行归类。归类的具体项目有,声类接近度的聚类分析、韵类接近度的聚类分析、调类接近度的聚类分析、声类和韵类接近度的综合聚类分析、声类韵类和调类接近度的综合聚类分析等等。

聚类分析的数学公式为:

D表示接近度,I和J分别表示两个不同的小类,i和j分别是I类和J类的组成成员,n表示小类中成员的个数。整个聚类过程,就是一级一级地把众多的个体或小类中两个平均接近度值最大的个体或小类归并为较大的类。为了便于考察分析,我们把聚类结果制成了树形图。⑥

5、下面就对声韵调接近度综合统计所作的聚类分析(见附录一)和传统的汉语方言分区作一个粗略的比较。

根据聚类分析,可以把二十个方言点分成三个组。

第一组是北京、济南、西安、成都、武汉、扬州、合肥、长沙、双峰、太原。

第二组是广州、阳江、梅县、厦门、福州、潮州、南昌。

第三组是苏州和温州。

建瓯情况特殊,暂不作归并。

第一组内部接近度为0.897时,北京、济南、西安、成都、武汉、扬州、合肥等方言点便聚集在一起,这就是官话区。官话区内部还可以分成两块,一块是扬州和合肥,即江淮官话区,接近度为0.940;另一块是其他方言点,接近度为0.952。长沙和双峰同官话区的接近度分别为0.872和0.834,长沙和双峰之间的接近度为0.854。从全局考虑,把长沙话归入官话是可以的,把双峰话归入官话就不合适了;还有一种选择是把长沙话和双峰话归为一区,而后再分成新湘语和老湘语两小区,不过新老湘语的差异是非常大的。太原话同其他方言点的接近度为0.810,差距是最大的。太原话完全有资格从官话区里独立出来。太原话最大的特点是平声不分阴阳。现在的问题是归属晋语的一百七十四个县市中,只有三十二个市县平声不分阴阳,除了这些市县外,晋语声韵调方面的特点同江淮官话非常接近。⑦可见太原话能从官话区中分离出来,不等于晋语能从官话区分离出来。解决的办法无外乎三种,a.晋语一分为二,把平声不分阴阳的三十二个市县从官话区分离出来,独立成一区。b.考虑到晋语的统一,让晋语整个留在官话区内,自成一个小区,地位同江淮官话相等。c.晋语整个从官话区中分离出来,同时把江淮官话也从官话区分离出来,晋语和江淮官话各自成一大区。从各大方言区之间的接近度来看,晋语留在官话区中,自成一小区似比较合适。

第二组内部可以分成三大块。第一块接近度为0.886,它们是广州、阳江和梅县。其中同属粤语的广州话和阳江话接近度为0.971,音类上非常相似。梅县话属客家话,同广州话、阳江话相比,显然存在一定的差异,但与属赣语的南昌话相比差距就更大,两者的接近度为0.828。仅就梅县话来说,把它归入粤语也未尝不可,但客家话分布在我国七个省区(广东、广西、福建、台湾、江西、湖南、四川),一百多个市县的辽阔土地上,需要选择更多的方言点来进行比较,才能确定客家话是独立存在呢,还是分成几块分别划入有关的大方言区。第二块接近度为0.879,它们是厦门、福州、潮州,可见闽南方言和闽北方言合二为一是合理的。值得注意的是建瓯表现出与这三个方言点明显不同的特点,建瓯同它们的接近度分别为0.768、0.780、0.770,建瓯话的归属需要进一步研究。第三块只有赣语的代表南昌话一家。南昌话和同组的其他话相距甚远,接近度为0.821,由此看来赣语作为一大方言区也许没有什么问题。

第三组只有同属吴语的苏州话和温州话,接近度为0.847,差距之大,超过了一些大方言区之间的差距,这迫使我们考虑把它们划在一大方言区内是否合适。

6、作为区划汉语方言的一种方法,应该说以古音类为标准的定量分析法还存在着不少需要改进的地方和进一步探讨的问题。第一,统计采用一字一音的处理方法,没有考虑一字多音的情况。方言里存在着的文白异读或一字多音的现象,实质上是反映了语言的动态变化。第二,统计没有考虑各方言出类字的各种不同归并情况,在相当程度上影响了区划方言的精度。第三,古音类的确定是否得当?如《切韵》的三十六声母是否可以直接拿来作为古声类,古韵类是否应该划分得更细一些等等。第四,各方言符合古韵类阴阳入三分的标志是阴声韵以元音收尾、阳声韵以鼻音(或鼻化音)收尾,入声韵以塞音收尾,这种规定是否恰当?因为有些方言古阳声韵或古入声韵的辅音韵尾虽然脱落,但并没有和古阴声韵混在一起,而是自成一类。如苏州话古阳声韵读Ф、iФ、uФ韵母的,长沙话古入声韵读io韵母的,成都话古入声韵读Yo韵母的等等。第五,用来统计的数学方法是否适用合理等等。

最后,我们要强调说明的是本文的目的是想提供一种新的划分汉语方言区域的研究方法,而不是实际划分汉语方言区域。如果把传统的方言分区当作参照系,那么以古音类为标准的定量分析法所统计的结果与它大体一致,就在一定程度上证明了这种新的分区方法的有效性和可行性。

附录一

在声韵调接近度综合统计基础上的聚类分析:

(1)0.986=北京、济南。

(2)0.973=北京、济南、西安。

(3)0.971=广州、阳江。

(4)0.964=成都、武汉。

(5)0.952=北京、济南、西安、成都、武汉。

(6)0.940=扬州、合肥。

(7)0.910=厦门、福州。

(8)0.897=北京、济南、西安、成都、武汉、扬州、合肥。

(9)0.886=广州、阳江、梅县。

(10)0.879=厦门、福州、潮州。

(11)0.872=(8)+长沙。

(12)0.852=(9)+(10)。

(13)0.847=苏州、温州。

(14)0.837=(11)+双峰。

(15)0.821=(12)+南昌。

(16)0.810=(14)+太原。

(17)0.782=(15)+(16)。

(18)0.764=(17)+建瓯。

(19)0.740=(13)+(18)。

注释:

①参看薛才德《现代汉语方言分区方法问题初探》《语言研究》1991年第二期。

②根据王福堂老师提供的复印件,此书于1989年6月正式出版。

③阳江话的个别字有对立关系。如:[‘ji]≠□□□[′i][i]:二胡,[wui]≠□[ui](猪哼声)。

④参看郑锦全《汉语方言亲疏关系的计量研究》,《中国语文》1988年第二期。

⑤接近度统计是在IBM-PC-AT型计算机上进行的,程序的设计和具体操作由中科院自动化所杨子冬同志协助完成。

⑥因篇幅和印刷方面的原因,删去原文中的声韵调合类字和出类字统计表、接近度统计表、聚类分析表和聚类树形图表共17张。

⑦参看侯精一《晋语的分区(稿)》,《方言》,1986,253-261。

标签:;  ;  ;  ;  ;  ;  

根据古代语音的分类,用定量分析的方法将汉语方言划分为汉语方言_方言论文
下载Doc文档

猜你喜欢