澳大利亚和越南语的核心词原则及谱系树的分类_官话论文

核心词原则和澳越语的谱系树分类,本文主要内容关键词为:谱系论文,核心论文,原则论文,澳越语论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

【中图分类号】H003【文献标识码】A

【文章编号】1001-8913(2002)01-0098-04

学者们公认在东南亚和太平洋地区存在一个南岛语系或马来-波利尼西亚语系(Austronesian language phylum or Malayo-Polynesian language phylum)。该语系是世界上分布很广的大语系,包括1000来种语言,说这些语言的人口在2亿5千万以上。在东南亚还存在一个南亚语系(Austroasiatic languge phylum),包括150来种语言,使用该语言的人口在4千万以上。在中国西南和东南亚存在一个大语群,即侗台语(Kam-Tai),该语群的语言在形式上和南岛语系很少有相似之处。Benedict (1942,1976,1991)提出了另一个澳台语系(Austro-Tai)的假说,该语系包括南岛语和侗台语。Benedict的证据是,在侗台语和南岛语之间有一些有语音对应的基本词汇。后经过很多学者的分头研究,以及我们最近的分析结果,可以比较肯定地说,侗台语和南岛语有同源关系,我们把这两个大语族以及其他和澳越语有同源关系的语言所构成的语系称为澳越语系。“澳”指原始南岛语,“越”指原始百越语(侗台语为百越语最主要的一支)。澳越语和汉藏语、南亚语、苗瑶语的同源关系还没有最终得到证明,所以我们所说的澳越语不包括这些语群。

确定了澳越语系以后,就需要对澳越语进行谱系树分类,以明确澳越语诸语言的分化过程,弄清其亲缘关系的远近。对同源语言作谱系分类可以从语音、语法特征的共同性入手,这种方法可以称为结构特征分类法。但在我们所进行的具体分类工作中,这种分类方法实际操作起来会遇到很多问题,因为两个亲属语音分化以后,其语音、语法可以相互借用,所以现代亲属语言的共同特征并不一定是两个亲属语言分化以前的共同特征。共同的语音、语法特征有可能是按照语言演变的普遍趋势发展出来的,也可能是亲属语言相互接触形成的,还可能是亲属语言共同受其他语言影响形成的,因此语音、语法特征常常会形成交叉现象,比如根据数量词的位置,仫佬语和侗语相近,数量词都在名词前,但根据动物性别词的位置,仫佬语和傣语相近,性别词都在动物名词后,拿这两个标准中的任何一个标准来确定仫佬语和侗语、傣语亲属关系的远近都会有争议。我们也尝试过这样的做法:列出存在于这三个语言中的任何两个语言之间的结构特征,然后比较哪两个语言享有更多的特征。但是两个语言享有的结构特征多并不总能证明亲属关系近,仍然可能是接触的结果,比如金沙江地区的傣语深受汉语影响,很多结构特征和侗水语一致,如果因此把金沙江傣语作为侗水语的下属语言,就不能反映金沙江傣语的历史。

我们也考虑过用历史上一些重大的历史音变规律来确定亲属关系的远近。比如汉语中的浊音清化、平分阴阳、入派三声等重大音变规律,就有人用来作为汉语方言历史分类的依据。但是,重大音变规律在当代亲属语言或方言中的体现仍然是结构特征,所以仍然不能解决用结构特征确定亲属关系远近所遇到的困难。另一方面,语音特征是错综复杂的,根据入声字归阳平的特点,可以把云南话归入汉语北方方言西南官话,根据是否区分平卷舌的特点,又可以把云南话归入汉语北方方言北方官话或江淮官话。

由于结构特征在划分谱系树、确定亲属关系远近时会遇到上述困难,我们放弃了用结构特征进行谱系树分类的做法。

下面我们考虑对100核心词进行聚敛分类。 这一方法的基本思想是,两个同源语言100核心词中同源词数量越多, 它们的亲缘关系就越近。Swadesh(1955)首先用100核心词来确定同源语言的分化年代。王士元(1995)首先根据这一思想用Swadesh的100词划分了侗台语的谱系树。当时还不清楚这种划分是否能真实反映同源语言亲缘关系的远近,因为有两个问题还没有得到解决:

1.如果100核心词的衰变率在不同的亲属语言中差异较大,100核心词中同源词的保留率就不能反映同源语言亲缘关系的远近。

2.如果核心词也容易借用,聚敛分类的结果就不一定完全反映亲缘关系的远近,在某些方面反映了可能接触的结果。

关于第1个问题,徐通锵(1991)将汉语方言100核心词中同源词的保留率和文献中所记录的汉语方言分化年代做了比较,同源词保留率基本能反映方言的分化顺序。我们曾经分析过小乘佛教传入傣族地区的年代,也分析过德宏、西双版纳傣语和未受佛教影响的金沙江傣语100 核心词中同源词的保留率,该保留率也基本能反映金沙江傣语从原始傣语分化出来的年代。因此我们认为不同的同源语言100核心词中,同源词的衰变率基本上是一致的。

再来看第2个问题。为了弄清核心词借用率, 我们对西南官话和台语的接触进行了追踪调查,我们发现在保持语音对应的前提下,100 核心词作为自由语素借用的情况相当少。在各地傣语方言中,除了元江傣语有一个“杀”字是西南官话词,西双版纳、德宏、临沧、金沙江等地均未发现100核心词中有西南官话借词, 只有少数语素是以黏着方式借入的,如“星期一、星期二”中的“一”和“二”。在我们所调查分析的几十种侗台语或侗台语方言中,100 核心词中借入西南官话借词也很少。1990年,我们曾对滇藏川三角地带的十几种藏缅语族语言进行过核心词调查,没有发现西南官话借词。1999年我们又在云南、西藏对藏缅语十几种语言的关系词作了专门调查,均无西南官话词借入藏缅语核心词。西南官话在侗台语、藏缅语地区有很大的势力,很多民族都会说西南官话,从民族语言到西南官话的母语转换也频繁发生。有些地区还有汉族说民族语言,使当地民族语言的结构面貌发生了很大的变化。即使在这样一种深刻接触的背景下,100核心词仍然很稳定。

由于100核心词的借用率很低,并且衰变率基本上是均匀的,用100核心词中同源词比例的高低来确定同源语言亲属关系的远近比其他方法似乎更可靠。至于Swadesh的200核心词,其稳定程度不如100核心词。在我们所做的调查中,200核心词都有不同程度的借用,所以我们不准备用200核心词中关系词的比例作为亲属关系远近的根据。 现在有的学者提出了新的核心词词集,由于这些核心词集现在还没有在专项调查中经过检验,还不好断定其稳定程度,我们也暂时不用这些词集中的关系词比例作亲属关系远近的根据。

根据我们的数据库建立起来的对应规则,我们可以得到澳越语中几种有代表性的语言100核心词中同源词的比例:

该同源词表中的数量均是100核心词中同源词的数量比例, 基本上代表了每两个语言亲属关系的远近,比例越高,两个同源语言的分化时间越晚,或者说两个同源语言的发生学关系越近。根据共同核心词在不同语言中的差异,就可以划出谱系树。这个过程就是从同源词比例表到谱系树的转换。当语言很少的时候,从同源词比例表到谱系树的转换比较容易进行,比如台语北部语群的三种语言:

容易看成,布依语和武鸣壮语的同源词比例最高,这两个语言是较晚分化的,谱系树很容易给出:

随着同源语言的增多,谱系树的转换很难通过手工或凭直观得到,比如根据前面澳越语同源词表,很难判定某个语言在谱系树中的位置。这时我们面临相当复杂的计算问题。这时从同源词比例表到谱系树的转换会成为一个相当复杂的数学问题,问题的核心是怎样把由比例构成的相似矩阵转换成谱系树。生物学家和群体遗传学家为了研究物种或人种的亲缘关系,也遇到了相同的数学问题。数学家为此编制了很多程序。这里我们不打算讨论这个复杂的数学问题,下面是根据Kitch软件计算出来的澳越语谱系树:

这棵谱系树的最基本的涵义是:南岛语和百越语首先分开,然后百越语中的黎语首先分化出来,最后台语和侗水语分开。这棵谱系树所反映的侗台语分化过程和目前学界有关侗台语(即我们所说的百越语)谱系分类的观点有些区别,主要体现在下面几个方面:

1、学界公认侗台语包括黎语支、台语支和侗水语支, 但没有下结论说哪一支先分化出来。我们给出的谱系树说明黎语支首先从百越语中分化出来。

2、学界一般认为侗水语包括侗语和水语两支, 侗语支有侗语和仫佬语组成,水语支由水语和毛南语组成。我们的聚敛谱系树分类反映出仫佬语首先从侗水语中分化出来,接着是毛南语分化出来,侗语和水语最后分开。[1]

3、学界通常接受李方桂的观点,认为台语(壮傣语)包括北部、 中部、西南部三个语群,但没有断言哪个语群首先从台语中分化出来。我们给出的谱系树反映了台语首先分成傣语和壮语两个语群,然后各语群才进一步分化。

上面的谱系树只是对目前学者们比较熟悉的南岛语、百越语的分化过程作了发生学的解释,随着越来越多的百越语的发现,实际情况更为复杂。在Benedict的谱系树分类中,曾经提出了加岱语支,包括黎语、仡佬语、普标语、布央语、拉基语,是和台语、侗水语并列的语支。我国学者后来在Benedict的基础上,做了一些改动,把仡佬语、普标语、布央语、拉基语看成一个独立的语群,和台语、侗水语、黎语3 个语支并列,成为侗台语的第4个语支,称为仡央语支。 这两种分类方式基本上都承认仡佬语、普标语、布央语、拉基语和百越语有同源关系,根据我们的有阶分析,仡佬语、普标语、布央语、拉基语和其他百越语都是高阶同源词比例高于低阶同源词比例,确实和其他百越语有同源关系。但是,把仡佬语、普标语、布央语、拉基语作为百越语的一个独立语支,得不到核心同源词的支持。根据我们对所建立的同源词数据库的分析,在100核心词中,黎语、仡佬语、普标语、布央语、 拉基语之间同源词的比例比台语内部诸语言之间同源词比例要低得多,也比侗水语内部诸语言之间同源词比例的比例要低得多,甚至比台语和侗水语之间的同源词比例还低,也就是说,这些语言之间的发生学距离比台语和侗水语之间的发生学距离还大,把黎语、仡佬语、普标语、布央语、拉基语归入一个语支而把台语和侗水语看成两个不同的语支,不能够反映百越语的历史分化过程。

为了更清楚地反映澳越语诸语言发生学的距离, 我们再次依据100核心词中同源词的比例,通过kitch计算程序, 把同源词比例矩阵转换成谱系树,结果如下:

这个结果说明,黎语、仡佬语、普标语、布央语、拉基语等并不是一个独立的语支,它们之间的关系是很遥远的,自从南岛语和百越语分开以后,仡佬语最先从百越语中分化出来,后来,拉基语、布央语、普标语先后分化出来,其后黎语和侗台语分开,侗台语最后再分化出侗水语和台语。

余论

用语法、语音特征画谱系树有相当的难度,这是我们考虑核心词中同源词比例并用聚敛谱系分类法画谱系树的重要原因。一棵有效而准确的澳越谱系树不仅对历史语言学有重要意义,而且能够反映原始澳越人的历史分化过程,这对民族学和考古学都有重要意义。我们给出的澳越谱系树是聚敛谱系分类法的一个尝试结果,其有效性和准确性还需要做深入的研究。该谱系树的有效性是建立在两个经验事实基础上的:

1.100核心词比语法、语音系统更稳定,不易借用。

2.100核心词的衰变率在不同的亲属语言中基本是相同的。

随着研究的深入,调查工作的扩大,如果这两个经验事实不断得到验证,澳越语谱系树的有效性就更强。如果发现某些语法、语音特征比100核心词更稳定,就需要根据这些更稳定的语法、 语音特征画谱系树,并检验聚敛谱系分类的结果,更进一步断定这种方法是否有效。如果发现100核心词的衰变率在不同的亲属语言中差异较大, 聚敛谱系分类方法也应该放弃。

澳越语谱系树的准确性首先需要我们建立澳越语诸语言间严格的语言对应关系,找出同源词,排除不同时间层面的借词,这项工作做得越细致,澳越语谱系树就越能反映澳越语的历史分化过程。我们目前所建立的澳越语同源词数据库不能说在这方面的工作已经做得很完善了,随着研究的深入,我们或许会发现新的同源词,或许会发现某些过去认定的同源词是借词,这样澳越语同源词比例矩阵就会变化,谱系树的结构也会变化,更接近真实情况。

标签:;  

澳大利亚和越南语的核心词原则及谱系树的分类_官话论文
下载Doc文档

猜你喜欢