南亚语言同源性研究的新进展_高棉语论文

南亚语言同源关系研究的新进展，本文主要内容关键词为：南亚论文,新进展论文,语言论文,关系论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

南亚语系可能是东南亚和印度东部最“古老”的语系，大约包括160种语言，并有相当数量的方言，它们分布于中国广西、云南，以及越南、老挝、柬埔寨、泰国、缅甸、马来西亚和印度等地，使用人数大概有6673万。其中孟语和高棉语的文字最古老，字母形状及书写原则来自印度文字。尚存的最古老的铭文、碑文使用的是6世纪的古孟语文字，以及7世纪前后的古高棉语文字。越南语文字只在8世纪以前使用，20世纪初改用拉丁文字，外加一些符号和调号。南亚语的有些语言只有老年人在使用，现正慢慢消亡；然而，大语种的使用人数在逐渐增加。南亚语作为东南亚所有语言的底层结构，非常重要。但是南亚语言调查研究的历史较短，截至目前，由于缺乏足够资料，南亚语言的分类相当混乱。

2.早期南亚语言研究概述

1854年，美国浸信会传教士F.Mason首次涉及南亚语言研究。他识别出古缅甸最有名的孟语、孟人（Mon）及塔莱因人（Talaing）。塔莱因人所操语言与当时中-印半岛语言在发生学上不同，属于由印度蒙达语言，如柯尔语（Kole）和霍语（Ho，霍语也叫蒙达语）构成的另一语团。Mason认为孟语和蒙达语存在发生学关系。

真正开始涉及东南亚语言关系研究的文章出现在1854年出版的《印度群岛杂志》第4卷第345页的脚注里。那本杂志的主编J.R.Logan用了几百页的篇幅专门讨论亚洲人的来源，他认为亚洲人是在最近的史前时期从非洲过来的。在题为“印度太平洋群岛人类学”一文中，他指出，这个语系的覆盖范围应包括高棉语、孟语、占语和老挝、柬埔寨、越南的小语言，可能还包括越南语。从1856年开始，他着手研究“孟-阿南语”（Mon-Anam）的结构。他的孟-阿南语很明显就是南亚语，从“比较词汇”部分可判断出来。这个语系包括蒙达语、孟语、高棉语、越南语、卡西语（Khasi）、尼科巴语、皮尔语（Pearic）和亚斯里语（Aslian）。除认为孟-阿南语构成一个语团外，Logan还把孟-阿南语作为语言扩散的中心，它向外扩散影响了整个地区。后来的学者也接受了这种观点，最有名的要数Blagden，他于1890年代提出使用孟-阿南语多重扩散理论来解释亚斯里语的一些特征。Blagden（1894：22-3）把Logan当做“权威中的权威”，认为Logan早预测到这个结果，并解释道，他的目的只是“再次指出（多重扩散理论），虽不够完美，但Logan先生早在40年前就已开创了这种研究的先河”。

早期支持Mason和Logan最有名的学者是英国历史学家A.P.Phayre。后来许多学者在谈到南亚语系假说的起源时都认为要归功于Phayre和Mason二人。Phayre（1873）主要关注缅甸历史，他认为，缅甸勃固（Pegu）的曼语（Mun）与纳格普尔（Chutiá Nágpúr）的霍罗人（

）或孟达人（Mundá）——我们称之为柯尔人（Kols）——的语言有着惊人的相似。

1860-1870年代，Logan和Mason的思想广为流传。Cust（1878）接受了孟-阿南诺系假说，他把Logan的观点引为权威，并根据南亚和东南亚语言的实际情况，给孟-阿南语提供了较为狭隘的分类，包括中-印半岛和伊洛瓦底（Irawadi）的语言。他把喀拉尔语（Kolarian，指蒙达语）、卡西语、尼科巴语都划到不相干的语系（事实上把尼科巴语置于藏缅语的“岛语组”（Island Group））里。Cust显然否定了Logan的越南语系属研究，他强调指出，法国学界强烈反对把越南语和柬埔寨语放在一起。因此他呼吁需要做进一步的研究来解决这个矛盾。

几乎与Cust同时，Forbes于1881年出版了《印度支那语言比较语法》。他接受了孟-阿南语系假说，认为这个语系包括孟语、柬埔寨语和安南山脉的无数小语言，然而Forbes否认它们与蒙达语存在较远关系，他把此前学者们识别出的与蒙达语的相同点归于偶然相似和扩散。Forbes（1881：31）总结道，“两个语族的关系令人怀疑，似乎不需再做调查”。

很显然，Forbes受到Gamier的强烈影响。Gamier于1873年远征中-印半岛，在当地收集了大量小语言的词汇资料。Forbes充分引用了Gamier的调查资料。为使他的观点清楚明了，Forbes（1881：49）提供了孟语、柬埔寨语、阿南语（越南语）、斯丁语（Xtieng/Stieng）、巴拿语（Banar/Bahnar）、索克语（Souc/Sork）和荟语（Huei/Oi）的低位数词表，并声称“无可否认，头四个数词的词根在所有这些方言里都是一样的”。

Kuhn（1889）也为孟-阿南语收集了数词（比Forbes的更为广泛，分析得更为彻底），编纂了80个基本词汇比较表。19世纪中期的学者们都使用“孟-安南”（Mon-Annam）或“孟-阿南”来表示现如今我们所熟知的南亚语系的孟高棉语族。但在20世纪早期，许多学者像Kuhn一样，如Skeat和Blagden（1906），依然使用“孟-阿南”来指称整个南亚语系。

Kuhn（1889）基于明显的词汇同言线，把这些南亚语言分为5组。Kuhn（1889：219）说，他的分类只是暂时的，不过在卡西语、孟语、高棉语和东南亚的好几种语言间肯定存在某种联系。除此之外，Kuhn确定越南语起源于东北，远离现在的疆土。因此他推测越南人是外国人，后移民至此，与孟-阿南人发生接触，产生了一种在大范围里显得不太重要的克里奥尔语。

公平地说，Kuhn的作品在后来非常具有影响力，他采用了一种以编程方式进行大致预测的分析和表现模式，80年后依然有人使用。Kuhn（1889）中最具价值的一点就是对词汇的定性分析和定量分析。自1860年代中期以来，南亚语系分类研究的主要特点就是词汇研究，而Kuhn就是反复研究词汇。Kuhn另一个最具影响力的方面是他对越南语的态度。15年后，Schmidt（1906：7）专门借用Kuhn的怀疑态度来逃避对越南语的讨论。

Keane（1880）只看到了词汇扩散和偶然相似，不同意孟-阿南语系假说。他提出把亚洲语言分为两个大语系：中-印语系（包括汉语、越南语、泰语、缅甸语、卡西语及其他）和印度洋-太平洋语系（包括高棉语、马来语）。他把种族类型和语言类型学联系在一起，分类依据是说话者的肤色和声调的有无（在这个方面他犯了一些错误，如把芒语（Muong）当做无声调的语言，把卡西语归入声调语言）。

美国学者Wake（1890：18）通过讨论一些数词发现，高棉语与马来语不同，而与喀拉尔方言一致。但是他并非真正赞成比较语言学家们所设想的发生学关系。他认为，东南亚语言更像克里奥尔语，有各种来源，主要来自印度。对他而言，柬埔寨语主要来自印度北部的语言，包括梵语和喀拉尔语，而马来语“从根本上来说与喀拉尔语有同源关系，与蒙古语结盟，它的达罗毗荼语因子来自南方”（Wake 1890：84）。

Blagden（1894）直接根据Forbes和Kuhn的方法和结果，系统比较了孟-阿南语和马来土著语言。他非常简洁地列出了14页的比较词汇表，包括一些数词。隐藏在Blagden思想深处的是种族问题。他不仅把“矮小黑人”色芒人和“浅色皮肤的”萨凯人当做不同的种族，而且把他们与大陆的中-印半岛民族区别开来。几十年来他不断提出一些假设，这为20世纪南亚语系假说的批评者们提供了素材，同时，比较语言学家也把他精心设计的同源词表作为研究的源泉。

后来Blagden（1902）讨论了占语和色伦语（Selung（Moklen）），他认为，它们是操南岛语的人群占领中-印半岛时的残留，后来随着孟-阿南人的入侵，造成目前的格局。

19世纪后期以及世纪之交是南亚语言研究的转折点。在语言分类和语言类型学研究领域爆发了一场思想革命，不过由于种族的影响，阻碍了学者们清楚分辨事物的能力。但是20世纪的南亚语系研究取得了长足进展。如：识别出横跨印度至中-印半岛的语言关系，与现代南亚语理念相对应；语言学研究及田野调查资料收集触及南亚语系的大多数支系；研究了词汇和类型的异同，作为内部下位分支的基础；一些学者怀疑这个语系的外围成员是否可能是混合性或接触性语言而非共同祖语的直接子语。

很显然，下一步要做的是，对可用的南亚语资料进行系统的历史比较研究，以便构拟语言历史，重现语言真实，这也是Schmidt在二十世纪来临之际所取得的伟大成就。

3.现代南亚语言同源关系研究

第一个真正为东南亚语言研究打下理论基础的是有一定语言研究经验的德国人类学家Schmidt。1901年到1908年间，Schmidt发表了一系列讨论东南亚语言的文章，论述了孟高棉语和蒙达语、尼科巴语的密切关系，并将孟高棉语在东南亚的地位提到应有的高度。他将这些语言命名为“南亚语系”（Austroasiatic）。Schmidt（1901）为其首项研究成果，该文检查了马来半岛（现称为亚斯里）的色芒语（Semang）和萨凯语（Sakai），收集了所有已发表的资料，然后整合成一个包含1232个词条的比较词汇表，并示例说明。他从音系、形态和词汇三个方面入手，辨认出与其他孟高棉语言对应的很多形式。他的结论如下：色芒语与萨凯语同属一个语团，萨凯语分为两个下位语支，色芒语和萨凯语来自同一祖语。

Schmidt（1905）广泛比较了孟语、高棉语、斯丁语和巴拿语。此时他继续使用“孟高棉语”的狭义概念。所用材料均来自书面孟语和书面高棉语，以及巴拿语和斯丁语的现代词汇。他根据广泛收集的材料和900多个词进行比较，开始建立规则语音对应。他在构拟原始辅音系统和形态方面确实取得了巨大的进步，为后来的南亚语言比较研究打下了坚实基础。这在Shorto于2006年出版的《孟高棉语比较词典》里可以看出来。很显然，Schmidt（1905）为Shorto提供了一个大的框架。但是Schmidt无法提供一个令人满意的原始语音系统，以至于他自己也怀疑是否存在有规律的语音对应。

Schmidt（1906）根据对不同词汇和形态同言线（特别是雅利安语借词同言线）及其他结构特征的分析，假定了南亚语言的发生学分类。附录中Schmidt提供了尼科巴-孟-高棉语族，森塔里（Santali）-孟-高棉语族和南岛-南亚语系的同源系列。由于证据清晰，该假说影响广泛，虽被攻击达数十年之久，迄今仍屹立不倒。

在其最有名的题为“孟高棉人”（Schmidt 1907-1908）论文里，Schmidt试图把其掌握的所有语言学、人类学和地理学知识结合起来描述东南亚语团，再次提出包括南岛语（马来-波利尼西亚语）和南亚语的南方大语系假说（Austric）。此时Schmidt的南亚语系包括7种：1）混合语族；2）孟高棉语族；3）色诺（Senoi=萨凯语）-色芒语族；4）德昂（Palaung）-佤（Wa）-日昂（Riang）语族；5）卡西语族；6）尼科巴语族；7）蒙达语族。第一类混合语族肯定是错误的，因为其中的语言很明显就是印度尼西亚语。由于其片面性，Schmidt的分类整体来说存在很大问题，1926年他又做了修改。

Schmidt的直觉可能是正确的，但是证据远远不够。他对南亚语的研究很少是彻底、可靠、或是科学的。Schmidt南亚语研究的主要依据是假定的同源词表，但与之相反的同源词表却可以更充分地证明相反的理论，可惜无人来做。Schmidt把越南语排除在外，许多学者认为他不是经过仔细比较后得出的结论，而是缺乏调查研究。但是Schmidt的观点影响了一大批人，例如从Grierson对有关南亚语言亲缘关系的分析中，可以看到他是如何向Schmidt的新语法学派观点转变的。

对西方学者来说，关于孟-阿南语系/南亚语系特征的研究由于缺乏可靠资料而受阻。不过情况发生了巨变，1903年至1928年，Grierson主编出版了《印度语言调查》（以下简称《调查》，包括19本书，共11卷。其中，第2卷（1904）和第4卷（1906）与南亚语言研究息息相关）。《调查》是一部大型的语言调查实录，清楚地展示了现如今分布于印度、孟加拉、缅甸和尼科巴群岛的南亚语言资料。之前还有一卷《印度语言》，发表于1903年。在这一卷里，Grierson提供了第一次调查的结果，附有图表、彩色地图以及单纯从结构方面进行的南亚语言分类，并且不关心Mason、Logan及其他后来者的研究。他的南亚语言包含两个上位范畴：“印度-支那语系”（包括孟-高棉语、藏缅语和暹罗-支那语），和“达罗毗荼-蒙达语系”（包括蒙达语和达罗毗荼语）。Grierson使用了南亚语言广义上的名称“孟-高棉语”，并认为尼科巴语和越南语可能只受到孟高棉语的影响。

1924年，Przyluski在《世界语言》一书中的“南亚语言、孟高棉语言、安南语言”等章节里提供了更好的分类。他把南亚语系分为三个主要语族：蒙达语族、孟高棉语族和（前越南王国的）安南语族（Annamite）。Przyluski的分类与Schmidt完全不同。虽然都是三个语族，但是内部差异很大。那时已出现了芒语资料，而且芒语与越南语极为相似，还没有经历过剧烈的语音变化，因此非常利于语言比较。这种资料正是Schmidt和其他学者所缺的，因为它清楚地表明越南-芒语不能排除在南亚语系之外。

G.Maspero非常怀疑Schmidt及此前学者的观点。他对泰语、高棉语、越南语都做过研究。1915年，在其编著的《高棉语语法》中，G.Maspero对马六甲诸语、尼科巴语、卡西语和蒙达诸语是否属于南亚语系表示怀疑。他严厉批评Logan、Forbes、Müller和Kuhn提出的“孟-阿南语族”（这个语族包括孟语、高棉语、越南语、占语等）。G.Maspero承认孟高棉语和德昂语有发生学关系，其他都不确定。他对卡西语的否定来自他的推理（根据泰-越语关系的认定），即孟高棉语不会有声调。但后来的研究证明孟高棉语有两个声调。

H.Maspero把越南语排除在南亚语系之外，认为越南语与台语有关系。他在1912年就提出了这一观点，1929年和1952年再次申明。如果Maspero不认为越南语属于泰语，他就能在Haudricourt之前40年解决声调起源的问题。Maspero充分描述了越南语声调和音节首、音节尾之间的关系。现在看来，他有足够的材料进行声调起源的内部构拟。但那时他只是把越南语声调看作是音节发展的结果，后依照泰语的模式发展而来。

von Hevesy（1930）反对Schmidt提出的蒙达-孟-高棉语同源词，并找到其他同源词来证明蒙达语与芬兰-乌戈尔语同源。他在一系列论文中嘲笑南亚语系假说，把Schmidt的词汇比较贬得一文不值，强调蒙达语是一种高度合成的、加词缀的语言。但是Hevesy的研究也不具说服力，故Sebeok（1945）直截了当地说它完全不可靠，毫无价值。Briggs（1945）说，他不愿意放弃Hevesy的芬兰-乌戈尔语系假说，但他也同意Schmidt的观点，不过他没有增加新证据。

Schmidt的功绩在20世纪几乎无人能及。很明显，Hevesy和其他学者对他过于苛刻。

另一个不得不提的是Pinnow，他是第一个对蒙达语和南亚语语音进行系统构拟的学者。他于1959年出版的《卡里亚语（Kharia）的语音学尝试》一书是南亚语比较研究的里程碑。他也是唯一一位对南亚语动词形态进行系统比较构拟的学者，因而受到学界好评。他对蒙达语族的卡里亚语进行了细致研究，并仔细构拟了原始蒙达语，同时指出其与其他南亚语言的相似性，然后对构拟原始南亚语给出了一些谨慎的建议。Pinnow认为，全面细致的研究是首要条件。他也试图提供一份南亚语言的总目录。他还认为，蒙达语保留了古代语言形态的复杂性，这个只在其他南亚语里隐约找到一丝痕迹，如高棉语尾辅音交替。他把南亚语系分为东支（蒙达语支）和西支（高棉-尼科巴语支）。

一个世纪以来，学者们对湄公河流域和安南山脉的语言还没有一个正确的分类，只是笼统地称之为孟高棉语。似乎孟语和高棉语是中心，往山上延伸的只是方言连续体。1960年代夏季语言研究中心和越南学者联手，进行了系统的词汇调查，并根据Bloomfield的原则确定村庄的位置。他们渴望使用不同的“新”方法来探讨，如Swadesh的词汇统计学。1966年Thomas发表的“越南的孟高棉语分类”是重要的分水岭。由于年轻学者都乐意分享他们的田野调查资料，Thomas才能够把Swadesh的方法应用于此前学者们笼统称为“孟高棉语系”的20种语言，并取得突破性进展——除孟语和高棉语之外他还找到了两个分支：卡都语支（Katuic）和巴拿语支（Bahnaric）。文章末尾讨论了调查数据，并把比较范围延伸至孟语和高棉语。从此其他学者也放弃了Schmidt提出的由克木语（Khmuic）和亚斯里语构成的孟高棉语团。

Thomas（1966）的研究方法是一个转折点。以前南亚语言分类研究总是结合类型学、地理学，外加精心挑选的词汇同言线。而词汇统计学作为一种新的分类方法，忽略类型学和地理学，相比这个领域以前使用的无系统的方法，显然是一种进步。Thomas使用这种方法得出了一种清晰合理的结论，因此该方法被广泛用于南亚语言研究。自此一大批学者开始运用词汇统计学方法研究南亚语言，特别是夏季语言研究中心的学者们，还包括一些研究南亚语言的俄罗斯学者。

Thomas和Headley（1970）以Thomas（1966）的文章为基础，使用增加的田野调查资料和过去发表出来的词汇及语音对应材料，广泛开展这方面的研究。文章包括除蒙达语之外所有其他的南亚语言支系。这次研究以Swadesh 200词表为基础，综合考虑了东南亚语言的各种条件，产生了207词表。该文章的主要成就在于首次识别出与高棉语相别的皮尔语支，并创造了术语“皮尔语”。还应注意的是，芒语（Mang，越南北部靠近中国的一个小社团所说的语言）似乎也是在英语资料中首次出现，并暂时与德昂语放在一起。

该文与Thomas（1966）一起，在学界产生了极大影响，他们把12个分支暂时分为4个语系，9个语支，这为后来的经验主义研究搭了一个框架。从此以后，这个问题就简单多了，人们只需询问它们中的一种或多种语言是否能构成一个语支。

另一位重量级学者Huffman（1976）同样认为传统的Swadesh词表是不完善的，因为不同的语系可能有自己的语义结构。传统的语言年代学不具有普适性，不适用于所有地区的语言分类，而修改后的Swadesh词表也只适用于语言调查分类。因此他为南亚语设计了两种特殊的100词表和500词表。

Huffman没有像其他人那样提供语言分类。不过他于1978年在第二届南亚语言学国际会议上所提交的数据虽然没有发表，但是流传甚广，影响很大。Huffman（1978：5）写道，由于词汇统计学的局限性，他提供的结果只是为了“使我的同事们思考、判断，可能还夹杂一点娱乐的成分”。他最重要的发现是，卡都语和巴拿语之间同源词比例（52%-55%）数量惊人，因此他建议“（二者之间）太相似，只有把它们归入同一个语族”。南亚语系通常处于一种亲缘关系的连续体状态，卡都-巴拿语的同源词比例高于其他语支。因此很难用谱系树理论来解释这种现象。Huffman认为，越南是扩散的中心，而“每一种南亚语都在独自向西移动”。

现在对南亚语言的研究已出现多种方法。各个学者都采用自认为合理的方法论来讨论南亚语言，得出的结果可想而知。1976年，Headley使用三种不同的方法论，对8个语支的大量资料进行对比，产生了几种截然不同的分类结果：

（1）根据音系特征的分类

（2）根据同源词比例的分类

（3）根据词汇创新的分类

Headley（1976：499）说道，总的来说，虽然高棉语与孟高棉东部语支有紧密的关系，但是在南亚语系内部却自成一体。

同时，他还回顾了不同学者的南亚语言分类，提到一篇有关词汇创新的未公开发表的文章，它“改变了Thomas-Headley的分类”，即：1）皮尔语支；2）高棉孤立语（Khmer Isolate）；3）孟高棉东部语支；4）孟高棉北部语支；5）马六甲语支；6）卡西孤立语（Khasi Isolate）；7）尼科巴语支。不巧的是，Headley从没找到那篇未发表的文章。不过这种分类对后面学者的研究产生了很大影响。特别是对东西语支的详细分类影响了后来Diffloth（1979）的三语支分类。因为Diffloth认为他后来的分类也是基于词汇创新。同样值得注意的是，Headley的分类与Peiros基于词汇统计学的分类惊人地对应。

1970年代早期，（法国）国家科学研究中心在《东南亚和印度洋世界》系列中出版了三部人类语言学地图集。Matras和Ferlus（1971，1972）撰写了第一部和第三部，前者详细讨论了南亚语言的分类，后者评价了不同语言中记录有“狗、牙、盐”等词的地图。他们提供了一份包含12个语支的语言名单。这份名单综合了Maspero（1929）、Haudricourt的手稿，以及Thomas和Headley（1970）的研究成果。Ferlus基于词汇统计学和词汇创新，假定了一个下位语系“北南亚语系”，包括德昂语、克木语和芒语。这篇文章包括含“狗、牙、盐”义的62种有记录来源的比较词汇表，基本上延续了Maspero（1929）假定的德昂语和克木语分类，不过Ferlus增加了一种语言：芒语。

这一阶段的南亚语系研究取得了很大进展，研究者越来越多，一些学者专门收集有关南亚语言的研究资料。如Pinnow（1959）、Parkin（1991）等提供了南亚语言较好但不完整的参考书目。不过一些早期学者的重要作品未列出，如Burrows（1915）。而一些有关蒙达语的最新著作也没列出，如由Bhuvanésvara部落语言与文化学院出版的英文版和奥里亚语（Oriya）版不同品质的语法和词典编纂的研究，如Sāmala和Patel（1997）等学者的研究成果。大量成果的问世，带动了其他学者的研究热情，如由Patnaik撰写的具昂语（Juang）新语法，Neukom撰写的森塔里语语法，都接近完美。由Zide领导的研究团队已经收集了蒙达语许多未发表的资料，现保存在芝加哥大学。Griffiths复印了芝加哥的许多资料保存在莱顿大学。Zide个人还收集了许多南亚语著作，包含许多未收录在参考书目里的资料。Pinnow退休后，他把私人图书馆馆藏的与南亚语和达罗毗荼语研究相关的一部分资料，包括一些稀有作品的复印件和原件，都捐给了柏林自由大学，现保存在人类学学院。Pinnow（1959）、Stampe（1965，1966）、Parkin（1991）还提供了有关蒙达语具体语言、操这些语言的人群以及语言分类的详细信息。Parkin（1991）还提供了孟高棉语言，以及说这种语言的人的行踪、数量及分布信息。Means和Means（1987）列出了有关亚斯里语言的几种来源。1963年由Shorto等编著的《孟高棉语和泰语书目》，搜集了从1859年至1960年的语言论著目录，是一本比较全面的工具书。1963年在西贡开始出版期刊《孟高棉语研究》（西文），为不定期丛刊。越战结束后转移到美国夏威夷大学继续出版，现已出版到第32集，内容相当广泛。有对具体语言或方言的研究，有从语音、词汇、语法、句法等方面的描写，还有民间传说的收集等，也有文章专门论述孟高棉语言之间的关系以及谱系分类等问题。1973年，在美国夏威夷大学召开了一次比较大型的南亚语言的国际性会议。会议已将论文汇集出版，书名为《南亚语系研究》Jenner，et al.1976），共收录352篇论文。内容包括对具体语言的描写研究到对整个语族乃至整个语系的历史比较研究。

这些著作、期刊的出版发表，基本上勾勒清楚了南亚语言的基本轮廓。

4.当代南亚语言同源关系研究

1980年代，随着重量级人物Shorto和Huffman的退休，南亚语研究几乎处于停滞状态。没有国际会议，没有大型项目。到了1990年代末，由于对田野调查的重新重视、计算机方法的应用、资料共享等原因，南亚语研究才又恢复生机。2007年第三届国际南亚语言学会议的召开，标志着南亚语言研究进入到一个新的阶段。

Pinnow之后的十年可以说是Diffloth的天下，他的《百科全书》影响深远。Diffloth对Pinnow的分类模式进行了修改。他根据Thomas和Headley（特别是1970年）的词汇统计学研究，进一步把孟高棉语做了细分。他的分类也许是截止到目前接受范围最广、影响最为深远的分类。

1974年，Diffloth根据传统的分类，把南亚语系分为两个语族：孟高棉语族和蒙达语族，并把孟高棉语族分为东支、北支和南支。显而易见，这个分类是对Thomas和Headley（1970）分类的修改。Diffloth把马六甲（亚斯里）语族去掉，把孟高棉语族分为三个语支。虽然Diffloth没提到Thomas和Headley（1970），但是一眼就可看出，他的分类直接来自这篇文章，并且几乎重复了大部分的分类。此时的分类主要依靠语言年代学方法。

1980年，Diffloth对南亚语系的分类做了修改，把越-芒语和其他孟高棉北部语支归入一组，位于同一节点，并在原来的基础上增加了一个语族：尼科巴语。因而此次分类包括三个语族：蒙达语、尼科巴语、孟高棉语。其中孟高棉语已不是由原来的三个语支构成，而是增加到12个语支。不过这个分类与Diffloth（2005）的分类有共同之处，特别是他把孟高棉南部和东部语支与孟高棉北部语支对立起来。Diffloth说，这个分类是应用历史比较法得出来的，也是对这些语言的共同性统计比较的结果。

可惜的是，很难追踪Diffloth关于南亚语系分类研究的精确发展轨迹，因为自1980年代早期之后，他就很少发表相关文章，有关的谱系分类似乎也是来自手稿和私人通信，如Matisoff（1991）、Chazée（1999）引用的Diffloth（1989）的分类，但他们都没有做明确的解释。

1992年，Diffloth等又有了新发表的文章（Diffloth and Zide 1992）。在这篇文章中，他几乎颠覆了1980年的南亚语分类，回到原初的分类。他把南亚语系分为两大类：孟-高棉语和蒙达语。

2005年，Diffloth再一次比较了南亚语系不同分支的构拟，试图根据共同创新来分类，不过这次的证据没有公开发表。他提出了一种新的划分方法，把北支（卡西-克木）单独划为一个语族。一方面，这是一种回归，因为又回到了1979年假定的孟高棉语北支对应其他语支的二元划分法。另一方面，蒙达语被降级了，因为它与其他两种主要的孟高棉语处于平等的地位。分类结果是，南亚语和孟高棉语没有任何区别，其他未命名的语支，包括从前所分的东部和南部语支被Diffloth统称为核心孟高棉语族。

2008年8月22日，南亚语言学学会举办的第18次会议召开，Diffloth在其提交的论文中说，他在2005年的分类中把蒙达语降级是为了回应使用类型学来证明语言发生学关系的错误做法。换言之，蒙达语不可能与孟高棉语关系遥远，它们是姊妹语，不能因为它们在类型学上的不同就否定它们的关系。另一方面Diffloth也承认，因为只找到了几百组蒙达-孟高棉语同源词，蒙达语与孟高棉语的关系不可能太亲密，应该把它看作与另一支孟高棉语地位相等的语言。

2003年，Higham发表了“语言和农业扩散：南亚语言和稻米种植”一文。他同意把南亚语系分为蒙达语和孟高棉语的观点。Higham提供了一系列有关稻米种植的同源词，把东南亚和印度一带的南亚语言联系起来。然后找到一些考古学证据，证明种植稻米的农民从长江河谷种植区向南、向西扩张。并且发现，南亚语言的分布与新石器时代以稻米种植，驯养牛、猪、狗的定居地的扩散一致。那些以狩猎采集为生的土著人可能操南亚语。

东南亚语言研究经常使用词汇统计学方法。它总是被当做一种有用的发现类型学的工具，优于比较构拟。而南亚语总是词汇统计学研究的焦点。最近使用词汇统计学研究南亚语言影响最广泛的当属Peiros（1998）。他的苗-南亚语系，可与Schmidt的南方大语系抗衡，这个假说把宏勉语和南亚语系语言连接在一起，他还提供了40多个词汇比较证据。对于南亚语系，Peiros提供了代表6个语支的16种语言的词汇统计学矩阵（只有尼科巴语除外）。

Peiros（2004）的南亚语言分类是基于共有词汇的百分比来进行的词汇统计学分类。他使用了超过100种语言的资料，以及Starostin充满争议的词汇统计学方法。这就意味着由于语言接触，语言之间的关系似乎比实际关系更加遥远。这个研究的结果与其1998年的完全不同。尼科巴语被置于孟高棉语里，蒙达语和卡西语放在高级别的语支里，而其余语言置于2个下位语支：孟高棉语北支（包括芒语、越南语、德昂语和克木语），孟高棉语中支（包括皮尔语、高棉语、亚斯里语、孟语、卡都语和巴拿语）。值得称许的是，所有数据和同源词都包含在内。事实上，当Sidwell（2009）使用非常熟悉的语言重复Peiros的研究来证明借词时，他没有找到这些内部分支的形态结构。

其他未发表的有关南亚语言分类的观点也见于已故学者Shorto的文章中。1970年代，Shorto忙于《孟高棉语比较词典》第2版的校订工作，他在引言部分讨论了这些语言的分类，但是直到2006年这部词典出版后人们才发现他提供的资料。

Shorto对原始孟高棉语的构拟基于把孟语和高棉语看作标准语言，代表整个语系。这种方法并没有促成一种更加详细的发生学分类。然而，Shorto对统计学方法非常着迷，并且试验了各种不同的词汇统计学研究方法，起码有4种：1）17种语言的50词表；2）基于Huffman（1977）的数据，18种语言的100词表；3）基于Benjamin（1976）数据的升级版，11种语言的146词表；4）200词表，包括《孟高棉语比较词典》草稿中所有同义词源，使用不同长度的词表（包括200词表，400词表，690词表）进行不同的试验。

在最近使用非词汇统计学方法研究的例子中，Sidwell（2005）考虑到是否有可能在孟高棉语言（即不包含蒙达语的南亚语系）的首辅音对应中识别出语音创新。他在研究中发现，硬腭音的演化为包括德昂语、克木语和卡西语在内的北部下位语支提供了证据，否则语支分类就没有强有力的证据了。这就意味着可暂时分为9个语支。Sidwell认为这9个语支构成了独立的孟高棉语系，它在地位上与蒙达语对等。如果事实如此，除了卡西语暂时被划入北部语支外，Sidwell的假说与Ferlus（1974）的观点一致。随后在东南亚语言学学会举办的第18次会议上，蒙达语再次被提起。Sidwell（2010）认为原始南亚语的13个语支等距地同时从蒙达语那里发散（见下图），类似耙的形状，与Diffloth“平面锤”的三分法不同。因为大量南亚语都在沿湄公河从东南向西北的中轴线上，有理由假定南亚语是从那个轴线扩散开来的。Sidwell称这个理论为“南亚语河流中心假说”（austroasiatic central riverine hypothesis）。

Sidwell对36种语言进行了词汇统计，认为传统划分证据不足，内部语支的证据很少。他发现，虽然巴拿语和卡都语之间存在不断增加的接触地带，除了地理上相距遥远的蒙达语和尼科巴语外，所有语支的语言与巴拿语和卡都语的相似度越高，它们与这些语支相距越近。因此，Sidwell采取保守的态度，认为基于目前的证据，南亚语系的十几个语支应与蒙达语族并列，处在同等的地位上。

21世纪的头十年，南亚语言分类研究不尽如人意。最大的不足是分类混乱，证据不足。同时，基于不同方法（如形态句法类型学、语音变化、词汇等）并没得到预期的相同分类，主要在于无法得到具有代表性或全面的材料（通常是无法资料共享而非无资料收集），而单个研究者面对庞大的数据也是一筹莫展。但是由于这十年软件和信息技术的使用，学者们在资料收集和资源共享方面取得了很大进步。同时采用“计算生物学”得到的结果与传统比较方法得出的结果逐渐趋同。

南亚语言研究者们基于Swadesh 200词表，利用计算生物学技术研究30种南亚语言，研究结果在2009年的第四届ICAAL会议上讨论并由Sidwell和Blench（2011）编辑出版。本次讨论最大的遗憾是没有把芒语包括进来，大多数语支还只有两三种语言，结果产生了如耙状的等距离语支谱系树（Sidwell 2015）。下位语支包括卡都语和巴拿语，还有一个包括德昂语、克木语和卡西语的北部语支，但没说清楚究竟是发生学分类还是地域性分类。

2010年学界又展开了一次讨论，结果发布在澳大利亚国立大学的网页上。这次讨论扩展到54种语言，包括芒语。延续前一次的研究，这次包括13个下位语支，但是没有提供强有力的证据证明卡都-巴拿语支和德昂-克木-卡西语支（卡西语更靠近德昂语）是否真的存在。

2014年伊始学界开展了第三次大讨论，材料更广，数据更全（sites.google.com/site/austroasiaticlanguages）①。每种语言包括192个词汇项，但语言数量减少到50种。Greenhill使用SplitsTree 4软件制作了“邻居网”（Neighbor Net），产生的结果与前几次一致。还有一个使用邻居网研究南亚语言关系的成果发表，即Dunn等（2013）对亚斯里语内部关系的详细讨论。值得注意的是，Dunn等（2013）也发现了三个语支，分别包括Kensiw语和Jahai语、Temiar语和Semai语、Semelai语，与Sidwell通过50种语言的研究结果一致。

邻居网最近证明南亚语存在一种高度分歧的谱系树，它不支持卡都-巴拿语和德昂-克木-卡西语是南亚语系的下位语支，同时还向我们展现了很多语支的内部关系。

2015年《南亚语系语言手册》（Jenny and Sidwell 2015）编辑出版。该著作包括两个部分，第一部分是对南亚语言的类型学研究和历史构拟，第二部分是每个语支的语法研究，包括亚斯里语、孟语、皮尔语、高棉语、巴拿语、卡都语、越南语、克木语、芒语、德昂语、卡西语、尼科巴语。内容翔实，涵盖范围广，是了解南亚语言最新研究成果极好的参考书。

同时《民族语》网站（Lewis，et al.2015）认为南亚语言包括大大小小169种语言，分属两个大的语族：孟高棉语族和蒙达语族，其中孟高棉语146种，蒙达语23种。

这一时期出现了一些语法研究成果，如Kruspe（2004）的《Semelai语法》、Burenhult（2005）的《Jahai语法》、Jenny（2005）的《孟语动词系统》、Alves（2006）的《Pacoh语法》、Peterson（2011）的《Kharia语法》等等。但是相比南亚语言的分类研究以及汉藏语研究的大量成果，语法研究成果还是很少。

在此基础上，第三届国际南亚语言学会议于2007年在印度浦那德干学院研究生研院（Deccan College Post-Graduate & Research Institute）召开（第二届会议于1978年12月19-21日在印度迈索尔举行）。这次会议由G.van Driem发起，K.S.Nagaraja组织。虽然会议规模不大，但是却把新老学者召集在一起，包括研究蒙达语、卡西语和尼科巴语的印度学者，以及在泰国、印度、中国、缅甸和马来西亚工作的东南亚学者和西方学者。第四届和第五届会议分别于2009年和2013年在曼谷和堪培拉举行。2011年原计划在曼谷的会议由于突发洪水而取消。每届会议的内容都相当广泛，从分类研究到具体语言的语法研究都有涉及。这些成果的出现，标志着南亚语言研究已进入到一个全新的阶段。

5.南亚语故乡的讨论

南亚语言分类的不可靠严重阻碍了原始南亚语故乡位置的确定。关于它的故乡定位学界有很多假设，这些都是依据各种不同的、暂时性的分类机制、古代借词的推定以及原始词汇的构拟。此外，这个问题近来受到越来越多跨学科研究者的关注，他们希望在南亚和东南亚地区寻求语言学、遗传学和考古学之间的某种联系（Sanchez-Mazas，et al.2008）。这些讨论大致可分为三种观点：

（1）西方起源，在印度北部或孟加拉湾附近；

（2）北方起源，在中国中部或南部；

（3）中部起源，在东南亚区域内。

西方起源论假说认为，蒙达语一定在很久之前就落户印度，他们在印度-雅利安人之前，甚至在达罗毗茶人之前就已经抵达此处。地名，特别是喜马拉雅地区的河流名，如

，可能来源于一个蒙达语表“河流”的词，这表明南亚语在印度次大陆北部是个古老的语言底层，它在喜马拉雅地区藏缅人出现之前抵达。Diffloth（2005）也同意西方起源论，他认为原始词汇构拟的热带动物名称排除了温带地区（如中国）。

另一种被广泛接受的观点是把南亚语的故乡定在古代的中国，特别是在长江中游沿岸，把南亚语与《史记》里提到的越国（Yuёh）联系起来，影响最大的是梅祖麟和罗杰瑞（Mei and Norman 1976）的文章。文中假定了各种汉语和越国语词语的南亚语词源。该文的观点现被视为最受欢迎的“事实”，多次被引用、转述。如Schuessler（2007：4）相信越国语“肯定是南亚语”，他列出了几百条古汉语-南亚语比较词（comparabilia）。但是这种“走出中国”理论存有很大疑问。他们假定的南亚语词汇来自古汉语，并且使用了说服力不强的语音和语义证据。学界经常把越国和傣族连在一起（Eberhard 1968），而壮族和傣族仍然居住在越国中心区域。

第三种观点淡化了蒙达语的意义，把南亚语的中心定在东南亚孟高棉语言区域。这个理论是奥地利著名民族学家R.von Heine-Geldern首次提出的，他的根据是南亚人群的现代地理分布状况以及人类学信息并综合了考古学的成果。一次大战时，他请病假期间写了一份研究报告，报告中他把阿萨姆和缅甸的人祭和猎头行为与早期的文化扩散联系在一起（von Heine-Geldern 1917）。这个理论后来被1950年代奥地利的著名人类学家C.von Furer-Haimendorf使用。他正确地区分出次大陆东边的巨石传统和印度南部晚很多的、相对短命的铁器时代巨石传统（von Furer-Haimendorf 1945）。东部传统可追溯至新石器时代，在南亚语人群中毫无改变地保留至今。虽然Pinnow（1963：151）不考虑南亚语起始地的具体位置，但是他也假定古代蒙达人是向西迁移的，他认为这些人是“第一批离开”南亚语地带的人群。

van Driem不愿放弃西部起源论，他提出了一种折中方案，假定是一种文化而非人口向西迁移到印度：

古南亚语言殖民者很可能是那些公元前3千年中期居住在泰国中部平原、湄公河三角洲和越南海岸的新石器时代人群，他们逼迫居住在马来半岛的矮小土著黑人说他们的语言。这些人当时从中国南部长江南岸的傣族引入稻米农业，稻米种植可能首先从东南亚向西传播，然后到恒河平原。（van Driem 2001：294）

辨别几种语言的关系，确定一种语言的系属，欧洲语言相对来说比亚洲语言显得容易很多。欧洲语言的形态和语法结构较易辨别，如印欧语和芬兰-乌戈尔语或闪语间的关系。而东亚语言没有规则或不规则的屈折变化，句法通常相同，因此比较语言学家只能完全依靠词汇。一些学者仅根据自己的主观判断来决定一种语言的谱系。早期学者如Schimdt和Maspero认为，南亚语存在一些混合语，但是后来的学者否认了这种观点。截至目前，南亚语言的研究还不成熟，还有许多工作要做。

①登录时间为2015年11月5日。

标签：高棉语论文; 越南语论文; 南亚历史论文; 阿南论文; 世界语系论文;

南亚语言同源性研究的新进展_高棉语论文

猜你喜欢