严式词源统计法与共享创新法,本文主要内容关键词为:统计法论文,词源论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
语源关系的判定与亲属语言(方言)的谱系分类都是历史语言学研究中的重要内容。语源关系的判定主要涉及的是语言之间亲属关系的确定。谱系分类则通过语言(方言)谱系树的构建反映亲属语言(方言)的分化过程,以及亲缘关系的远近。本文主要集中讨论和分析语言(方言)谱系分类的方法。 亲属语言(方言)谱系分类通常以谱系树的方式呈现。德国语言学家施莱歇尔于1862年提出了语言演变的谱系树模型,并绘制了印欧语的谱系树。在为亲属语言(方言)进行谱系分类并构建谱系树的过程中,最核心的问题是选择哪些语言信息作为谱系分类的标准,以及如何对所选择的语言信息进行处理。目前学者们选择的方法主要有两种:共享创新法和词源统计法。此外,李子鹤提出可以通过计算亲属语言(方言)间“同音关系差异率”来构建谱系树,即同音关系差异法,比较的对象是满足完全对应和普遍对应的基本语素在不同方言中的同音关系有何差异,其背后的原理是从共时的同音关系看出各个方言不同的历史发展。①从这一方法在纳西语方言中的实际运用来看,得到的结果与共享创新法和词源统计法基本一致。这种方法还没有在更多的亲属语言(方言)中展开检验,因此我们在这里不作更多讨论。本文主要对共享创新法和词源统计法进行讨论,并提出我们认为比较可行的谱系分类标准——核心词中同源词的比例,以及确定核心同源词的方法。 一、共享创新法 共享创新法(shared innovation)主要利用亲属语言(方言)中结构上“独特的共享创新”进行谱系分类和谱系树的构建,这是历史语言学中普遍接受的分类标准。②共享创新指的是原始语(原始方言)中的某些语言特征在一组后代语言中发生了同样的变化。比如汉语西南官话的重庆话和成都话入声归入阳平,就是共同创新。历史语言学将共享创新作为谱系分类的标准基于如下假设:一个语言会随着时间发展变化,分裂为两个或两个以上的后代语言;这些语言还会进一步发展分化为各自的后代语言。共享创新的出现是由于这一创新变化发生在原始语的某一个后代语中,这个后代语最终分化为多个语言,这些语言都会继承之前发生的创新变化。亲属语言(方言)谱系分类的目的就是确定哪些后代语言在发生学上的关系更近,即这些后代语言属于同一个分支,拥有一个共同的祖语。因此,可以通过共享创新来判断哪些亲属语言(方言)可能来源于同一个共同的直接祖先,在那个祖先从更上一层的原始语分化出来时,此类创新已经发生。在选择共享创新时,语音共享创新最常用,包括音类分合关系的变化和音值的变化,其次是词法创新和句法创新。汪锋③和汪锋、王士元④提出语义创新也可作为亲属语言(方言)谱系分类的标准,并分别应用于汉语方言和白语方言的谱系分类。 将共享创新作为亲属语言(方言)谱系分类的标准,必须注意以下几点。 首先,只有“共享创新”才能作为衡量语言(方言)亲缘关系远近的标准,共同存古应该排除。这一点在为亲属语言(方言)进行谱系分类时是非常重要的。一组亲属语言或方言,只有拥有“共享创新”,才能说明它们在与其他亲属语言或方言分化后,仍拥有一个共同的祖语,或者说经历过一个共同的发展阶段。而共同存古只是后代语言从原始语继承下来且没有发生变化的语言特征,并不反映这些语言在原始语分化后经历了共同的发展。为了更好地说明共享创新和共同存古的区别,我们假设有A、B、C、D四个亲属语言,已知这四个语言的谱系分类如下图所示: 第一次分化时,分化为两支,其中A-B这一支与原始语相比有一项创新X,C-D这一支与原始语相比有一项创新Y,另外还一项特征Z没有发生变化。第二次分化时,A-B和C-D这两支又分别分化为两个语言,由于语言中的许多变化是不可逆的,因此A和B会共享它们分化之前的创新X,C和D则共享创新Y。至于从原始语继承而来的特征Z,则有可能在A、B、C、D四个语言中分别保留下来,也可能会有个别语言丢失这项特征。假设特征Z只保留在B和D中,那么B和D就有一项特征是共同存古。在不清楚语言实际分化历史的情况下,如果我们将保留特征Z做为谱系分类的依据,就会以共同存古为理由将B、D分为一类,与实际的情况相悖。但是如果我们坚持以共享创新分类,就能够根据创新特征X将A、B划为一支,再依创新特征Y将C、D划为另一支。 然而,在很多亲属语言(方言)的谱系分类中,并没有对创新和存古进行区分,例如汉语方言的分区。关于方言分区的目的,朱德熙先生曾指出:“方言分区问题包含空间和时间的因素在内。所谓空间因素指的是方言的地理分布,所谓时间因素指的是方言的历史沿革,即方言之间的亲缘关系。方言区实质上就是方言亲缘关系在地理上的分布。因此划分方言区的时候应该选择能够反映亲缘关系的语言特征作为分类依据。”“划分方言区是给现代方言分类,可是分出来的类要能反映亲缘关系的远近。因此这种研究实质上属于历史比较语言学(historical comparative linguistics)的范畴。”⑤可见,汉语方言分区实际上就是汉语方言的谱系分类。但目前常见的汉语方言分区都同时运用了创新和存古标准。确定吴语的标准是系统保留全浊声母,确定官话的标准是全浊声母清化后平声送气上去入不送气,前者是存古,后者是创新。虽然就汉语方言形成的历史来看,“南方方言与北方方言的分裂取决于不再共享北方的创新”,将“有共享创新的北方方言划分出去,也就意味着……一支不共享创新的南方方言分裂了出来”⑥,但事实上只有“独特的共享创新”才能说明一组语言(方言)可能来源于同一个共同的祖先,否则的话,这组方言分化后极有可能是各自独立发展的,并不共享同一个祖语。汉语南方方言不再共享北方方言的创新,只能表明南方方言与北方方言发生了分裂,但无法确定分裂出去的南方方言是一支还是多支。例如,闽语有部分匣母归群、部分章组归见组、部分支韵同歌等少量上古汉语的特征,⑦说明闽语与其他汉语方言的分化是在上古汉语时期,但是仅凭这些特征无法证明曾经存在一个原始闽语,后又分化为现在的闽东、闽南、闽北等方言。闽东、闽南、闽北也可能本来就是独立的方言。原始闽语的存在只能通过现代闽语诸方言中“独特的共享创新”证明。 其次,并不是所有的共享创新在衡量亲缘关系时都是等效的。由于人类发音生理和思维模式方面的共性,有一些语言变化从跨语言角度来看是经常发生的,比如舌面后音在前高元音前发生腭化。有一些创新变化从跨语言角度来看很普遍的创新,比如腭化。这些创新完全有可能在不同的语言中独立发生,即语言类型上的平行演变。因此,将某一项共享创新作为谱系分类的标准时,必须确定这类创新不会在两个已经分离的语言或语言群中因为普遍的类型趋势独立地平等发展出来。 最后,两个亲属语言分化以后,如果仍处于的接触中,语音和语法可以会由于相互干扰而趋于一致,已经发生的音变也可能在亲属语言或方言间扩散,使现代亲属语言或方言在分化后仍出现共同的特征。例如,现代太原方言古全浊声母今读塞音塞擦音时平声送气仄声不送气,与北京话一致。但是如果考察太原周边的方言,就会发现古全浊声母今读塞音塞擦音时白读平仄一律不送,文读平声送气仄声不送气,例如祁县方言的“爬”,白读,文读是受权威方言北京话影响形成的。因此一般认为太原方言平送仄不送的特征也是受北京话的影响,太原作为省会城市标准语的力量更大,以致于平声不送气的形式已经基本被送气形式所取代。汉语方言中这种现象十分普遍,被称为叠置式音变。⑧虽然古全浊声母今读塞音塞擦音时平声送气仄声不送气是太原方言与北京话的共同特征,同时也是创新,但却是方言接触的结果。除相互接触外,亲属语言中的共同特征还可能是共同受其他语言影响形成的,比如在金沙江地区,傣语受汉语影响非常深,许多结构特征和汉语一致,与同样深受汉语影响的侗水语也较一致。如果因此把金沙江傣语也划入侗水语支,就会与金沙江傣语的实际历史相悖。亲属语言(方言)谱系分类中,接触造成的共同创新也是必须排除的。 但是,共享创新法选择的是亲属语言(方言)在结构方面的特征,这种方法也可以视作一种结构特征分类法。⑨这种分类方法在实际操作中会有以下一些问题。 首先,如前所述,不同语言中共有的语音、语法特征有可能是平行演变,也可能是亲属语言相互接触形成的,还有可能是亲属语言同时处于另外一种语言的强烈影响下形成的。虽然历史语言学在将共享创新作为谱系分类时,强调平行演变和接触引起的演变不能作为谱系分类的标准,但是目前如何将这两种演变与亲属语言(方言)继承自共同祖先的“独特的共享创新”区分开来,还没有一致的标准。 其次,不同的语音和语法特征的异同常常会在不同语言间出现交叉现象。以谱系分类中最常使用的语音特征为例,昆明话古入声字今读阳平,符合李荣所定义的西南官话的特性。⑩但如果考察的是否区分平卷舌以及平卷舌各辖那些字,昆明话的读音情况就十分复杂了,大致来说,知组除梗摄二等外都读卷舌,庄组根据韵摄不同有不同的读音,假、蟹、效、咸、山、宕、江摄读卷舌,章组一律读卷舌。(11)根据熊正辉对官话区方言分ts、类型的分析总结,昆明话与南京话在这一特征上是一致的,(12)那是否可以据此将昆明话归入以南京话为代表的江淮官话呢?因此在汉语方言区分中,不同的学者依据共享创新所得出的汉语方言谱系是不一样的。 由于共享创新法所运用的语言结构特征在划分谱系树、确定亲属关系远近时首先要排除借用和类型学上的普遍变化,还需要处理多个特征之间的冲突。这些问题目前还没有得到很好的解决。对语言接触的追踪调查表明,在语言接触的过程中越核心的词汇越稳定,越不容易借用。因此将同源核心词汇作为谱系分类的标准能够在很大程度上排除语言接触的干扰,相比共享创新法,词源统计法作为谱系分类的方法具有更强的可操作性。 二、词源统计法 词源统计法(Lexicostatics)是亲属语言(方言)谱系分类的重要方法,其基本观念是“两种具有亲缘关系的语言分离的时间深度,可以通过它们继承的词的共享程度来判断”(13)。Swadesh提出在任何语言中,日常基本词汇以一个相对恒定的速率变化。当一个语言社团分裂为两个或两个以上的部分,每一个新的社团中语言的变化都以独立的方式进行时,就可以通过语言中共同保留的词汇的比率来计算分化的时间。(14)有了分化的时间,也就有了谱系分类。词源统计分析法的重要步骤是设计一个通用的基本核心词汇表。这一词表必须满足两个条件:普遍性和稳定性,即不仅要在不同语言都能得到相应的词汇,还必须在语言接触过程中不容易被借用。Swadesh最初给出了一个包含200个词的词表,(15)后来又调整为100词表。(16)我们认为可以将Swadesh 100核心词中同源词的比例作为亲属语言(方言)谱系分类的一个样本。之所以选用Swadesh 100核心词,不仅仅是因为这一词表已经成功运用于世界上的多种语言,在语言调查中具有一定的普适性,还因为我们对100核心词的衰变率和借用情况都进行了考察,(17)稳定度比较高,可以作为语言谱系分类的依据。 首先,不同语言中100核心词的衰变率有较高的一致性。之所以要考察这一点,是因为如果100核心词的衰变率在不同语言间有很大的差异,其中同源词的保留率就很难反映同源语言分化的时间顺序,也就难以给出正确的谱系分类。关于这一问题,汉语方言和傣语方言都进行过有关的验证。徐通锵先生曾经考察了汉语方言中100核心词同源词的保留率,并与文献中所记录的汉语方言的分化年代进行了比较。结果显示汉语方言中核心同源词的保留率基本上可以反映各方言的分化顺序。(18)傣语方面的证据是对德宏傣语、西双版纳傣语以及金沙江傣语中100核心词同源词保留率的计算结果显示,傣语的分化大约是在明代。金沙江地区傣族与德宏和西双版纳不同,不信仰佛教,傣语的分化应该在佛教大规模传播之前。文献记载的小乘佛教在傣族地区的传播历史也反映佛教在傣族地区的传播始于明代。因此核心同源词保留率基本能反映金沙江傣语从原始傣语中分化出来的年代。(19)以上两项研究表明汉语方言和傣语方言中,同源词的保留率与文献反映的不同方言分化的年代基本一致,因此在不同的语言中,100核心词的衰变率基本上是一致的。 其次,核心词一般不会在语言接触中发生借用。如果核心词很容易通过语言接触传递,依据核心词的分类结果就可能无法完全反映亲缘关系的远近。对西南官话和侗台语、藏缅语接触情况的调查表明,100核心词中出现借用的情况是相当少见的。在侗台语和藏缅语地区,西南官话很多情况下是作为各民族间的通语使用的,甚至有人放弃了自己的民族语言,以西南官话为母语。即便是在这样的语言接触环境中,100核心词仍然很少发生借用。例如,在各傣语方言中,只有元江傣语的核心词中出现了西南官话借词“杀”,而西双版纳、德宏、临沧、金沙江等地都没有在100核心词中发现西南官话借词,只是少数语素会随着文化词汇进入民族语言的,如西南官话的“一”和“二”随着“星期一、星期二”进入了民族语言,但使用非常受限,正常计数时仍使用本民族语言的固有词。 综上所述,100核心词的衰变率基本稳定,在语言接触中的借用率也很低,基本上可以避免共享特征法中语言普遍变化和语言接触的干扰。因此,用100核心词中同源词比例更适用于同源语言的亲缘分类。至于Swadesh的200核心词在很多语言中都出现了借用的现象,因此不建议作为衡量语言(方言)亲缘关系远近的依据。目前也有学者提出新的核心词词集,但是这些核心词集尚未经过专项调查的检验,因此暂不考虑通过这些词集中同源词的比例进行同源语言的谱系分类。 当然,Swadesh的100核心词表并不能完全解决核心词表的确定问题,即100核心词表还不是最终的方案。核心词表还需要通过田野调查进行调整。如何给出更为准确适用的核心词表,是我们正在努力的工作方向。陈保亚、李子鹤尝试提出了一种核心词自动分阶模型。该模型以Swadesh的100词表和200词表为基础,基于大规模语音对应数据库,根据借用率来计算核心词的核心程度,并且自动把借用率低的词转移到高阶词集,把借用率高的词转移到低阶词集,同时在移动过程中自动寻找参数,确定高阶核心词和低阶核心词的界限,使得高阶核心词的借用率平均值达到最小值,低阶核心词的借用率平均值达到最大值。这一模型通过计算不仅可以避免确定某个词核心程度时的主观性,而且随着大规模语音对应数据库中语言数量的增加,对应规则的完善,以及区分同源词和借词准确性的提高,还可以不断地对核心词表进行改进。(20) 需要注意的是,通过100核心词中同源词比例来确定同源语言亲属关系远近,必须在严格建立语音对应规则并找出最早时间层面对应语素的基础上进行,这一点将在下一节中进行详细的论述。 三、严式词源统计法和谱系树绘制 对共享创新法和词源统计法的分析比较显示,核心词不容易在语言和方言间扩散,保持严格语音对应的同源词扩散更难。因此,相比基于语言结构特征的共享创新法亲属语言(方言)的谱系分类应该将100核心词中同源词比例作为首要依据,比例越高,说明两个同源语言的分化年代越晚,发生学关系越近。如果核心词比例接近,可以参考共享创新法的结果。根据共同核心词在不同语言中的差异,通过一定的算法就可以构建亲属语言(方言)的谱系树。因此语言谱系关系研究可以进一步可以分成两方面的工作,一个方面是算法研究,一个方面是对应语素的确定,前者主要是数学方面的工作,后者主要是语言学方面的工作。 目前存在的一个显著问题是,即使选择相同的调查材料,使用同样的数学算法,统计的结果也不一样。原因就在于语言学方面的基础工作不够扎实。为了使词源统计法更为有效,必须对其进行方法论方面的限制。严式词源统计法应该遵循下面的步骤:(21) 1.找出最早时间层面的对应语素。 2.通过有阶分布确定这些对应语素是同源还是接触的结果。 3.如果是同源的结果,再选择核心词或核心语符样本,计算出每两个语言的对应语符比例。 4.建立数学算法模型,计算并画出谱系树。 前面的工作是后面工作的基础。建立严格的语言对应并找出最早时间层面的对应语素是有阶分析的基础。也只有在确定了语言的同源关系后,谱系分类的工作才是有价值。建立语言(方言)间的语音对应规则,并找出最早时间层面的对应语素,是确定核心同源词的基础工作。事实上,即使是以“独特的共享创新”作为谱系分类的标准,找出最早时间层面的对应语素也是首先要进行的工作。因为共享创新法必须观察从原始语到后代语演变情况,而构拟原始语的基础也是最早时间层面的对应语素。 关于如何建立语音对应规则,确定最早时间层面的对应语素,我们认为可以通过建立完全对应、一致对应以及核心一致对应来确定一个核心一致对应语素集,(22)以此为基础来考察亲属语言(方言)间核心同源词的差异。 完全对应是指语素音形的每一部分都要对应,这是确定对应层次首先要做的工作。如果不坚持完全对应,仅仅根据话音形式的局部对应,很容易产生偶然对应。下面是从1000基本语素样本中找到的德宏傣语m和英语h对应的一个实例: 这种对应很可能是偶然对应。只有坚持完全对应才能够从概率上排除这种偶然对应,(23)建立语言(方言)间严格的语音对应关系。 完全对应也是区分层次的必要条件。要确定对应语素的时间层次,必须首先找出声韵调的对应规则。有些学者仅仅根据声母、韵母或声调三者之一的对应就确定时间层次,这种方法是不充分的。比如傣语的“三”,能够与汉语建立对应形式有两个:和。如果只看声母,由于声母是完全一样的,因此是无法区分层次的。但是如果建立韵母和声调的对应规则,就能判定前者是中古或中古以前的对应,后者则是西南官话层次的对应。这里的本质是一致对应。 一致对应就是一批语素在多种语言或方言中以相同的方式对应。不坚持一致对应,可能会把不同时间层次的对应混淆在一起。下面通过汉台声调对应的实例对一致对应进行简单的说明: 在以上材料中,“三、姜、光、宣”都是汉语阴平字,但在台语中的声调对应方式不一样,“三、姜”是一种对应方式,“光、宣”是另一种对应方式。我们说“三、姜”是一致对应,“光、宣”是一致对应,但“三、姜”和“光、宣”不是一致对应。造成这种对应方式的原因在于“光、宣”是在原始台语分化成不同的语言以后在不同的空间从西南官话借入的,这些分化后的台语语言按各自不同的音系以相似原则匹配西南官话语素。之所以能够得出这个结论,主要根据是形式和意义两个方面:从形式上看,台语诸语言的调值和西南官话相似;从语义上看,内容是很晚出现的。如果不区分这两种对应方式的话,就会将这两个不同时间层次的对应混在一起。 但对于历史上形成的不同的一致对应语素集,我们通常难以在形式和意义上找到判定时间层次的依据。尤其是史前时期,我们对当时的音值和语素的出现时间都不是很清楚。在以上材料中,如果没有西南官话帮助我们进行判断,汉语的阴平字在汉台之间这种一对多的现象在找不到语音条件的情况下,就存在两种解释的可能性:一种是这些语素本来是两类,在汉语中发生了合并;一种是这两种对应方式反映了不同的层次,其中至少有一个是接触的结果。如何区分这两种可能性,是目前对应语素层次分析中最困难的问题,因此在多个一致对应中找出最早时间层面的一致对应还需要进一步的研究。但是根据核心一致对应原则,可以确定一个关键的对应层次。 核心一致对应指的是非核心语素和核心语素在对应规则上的一致性。(24)前面讨论的汉台“三、姜”的声调对应和台语内部核心语素“雨、狗”的声调对应方式是一样的: 因此,“三、姜”属于汉台核心一致对应语素集,“光、宣”则不属于汉台核心一致对应语素集。由于核心语素的借用率很低,相对稳定,因此在已经判断为同源关系的语言或方言中,满足核心一致对应的核心词在很大可能上是同源词。 在计算核心词中同源词比例时,还必须区分词和语素。我们所说的核心词一定是词或语符。词或语符是语言中有规则活动的单位,通常是自由的。(25)之所以做这样的区分,是因为在语言接触中黏着语素很容易发生借用的情况。比如(三)在傣语中是词,但(三)在傣语中并不是词,只是“星期三”这个词的一个构词语素,借自西南官话。不是作为一个词借入傣语的,而是在借词传递的过程中作为借词中的构词成分被带入的,这一形式在傣语中无法自由使用,只是一个黏着语素。如果不区分词(语符)和语素,就不能准确计算核心词的比例。目前不同的学者使用词阶法、词源统计法,面对相同的调查材料有不同的结果,主要原因就是词(语符)和语素没有分开。区分词(语符)和语素,就要求我们在田野调查中要尽可能详细地考察每一个语素在语言中的实际使用情况,以准确判断该语素的性质。 根据核心一致对应和Swadesh 100核心词表,我们可以计算出亲属语言(方言)间核心同源词的比例,例如台语北部语群的三种语言之间核心同源词比例如下表所示: 容易看出,布依语和武鸣壮语的同源词比例是最高的,说明这两个语言是最晚分化的。如果只有这三个语言,就可以根据上表给出谱系树: 但是随着同源语言的增多,从同源词比例表到谱系树的转换会成为一个相当复杂的数学问题,问题的核心在于怎样把由同源词比例构成的相似矩阵转换为谱系树。在关于物种或人种的亲缘关系研究中,也面临同样的问题。现在已经有了一些计算程序,比如Kitch,Fitch和Neighborhood。陈保亚、陈泽浩也开发了一种用于语言谱系分类的快速算法SFF(Simulated Force Field,模拟力场算法)。(26)由于这主要是一个数学问题,因此我们在此不多作讨论。 作为亲属语言(方言)谱系分类中使用最为广泛的两种方法,共享创新法和词源统计法各有得失。共享创新法的优点在于严格区分了创新和存古在谱系分类中的有效性,只有“独特的共享创新”才能作为谱系分类的论据;缺点则是共享创新法主要利用的是语言结构特征方面的创新,但共同的语音、语法特征的出现除了可能是语言分化的结果,还可能是来自平行演变和语言接触。后者的影响必须排除,但目前还没有有效的办法。此外,不同的特征常常会形成交叉现象,使得依据语言结构特征构建谱系树有不小的难度。而相比语言结构特征,Swadesh 100核心词更为稳定,在语言接触过程中不易借用,保持严格语音对应的核心同源词更不容易借用,这是在语言接触的实际调查中得出的经验事实。因此,我们更倾向于使用词源统计法作为亲属语言(方言)谱系分类的方法。但是词源统计法也有一些问题,我们提出严式词源统计法对过去的词源统计法在操作程序上严格加以限制。通过在严式词源统计法的基础上计算Swadesh 100核词表中亲属语言(方言)核心同源词的比例并将其转化为谱系树来反映亲属语言(方言)的亲缘关系,然后再参考共享创新。如果这两种办法能够相互支持,则谱系树的确信度比较高;如果有矛盾,则严式词源统计分析结果仍为基本依据,这时共同创新很可能是接触扩散或类型上平行发展的结果。正因为严式词源统计法先于共享创新法,所以亲属语言(方言)中核心同源词的确定必须首先建立语言(方言)间严格的语音对应,尽量剔除不同层次的借词,得到核心一致对应语素集,以保证词源统计法的可靠性。 核心同源词比例在谱系分类中的有效性还需要在今后的研究过程中作进一步的检验。目前来看,核心词原则在谱系分类中面临两个难点问题。一是选择那些词作为核心词。目前我们正在做的工作之一是调整核心词集,即根据大量田野调查结果,将前100个最不容易扩散的词作为核心词。另一个难点问题是如何判断核心一致对应语素集的语源性质。同源语言(方言)间的对应语素,也有可能是分化后通过接触横向接触的成果,特别是在接触情况复杂深刻的汉语方言中,即使是核心词也只是比较稳定,不易借用,而不是绝对不会借用。如何更有效地区分同源形成的对应和接触形成的对应还需要更多的工作。此外,如果在今后的研究中发现某些语音、语法特征比核心词更加稳定,就需要将这些特征作为谱系分类的标准。我们希望随着语言演变研究的不断发展和深入,我们所得到的谱系分类能够更接近语言分化的真实情况。 ①李子鹤:《原始纳西语及其历史地位研究》,北京大学博士论文,2013年,第96~103页。 ②Lyle Campbell,Historical Linguistics:An Introduction,2nd edition,北京:世界图书出版社,1998/2008,p190~191。 ③汪锋,Comparison of Languages in Contact:The Distillation Method and the Case of Bai,台北:“中央”研究院语言学研究所,2006年,第12~14页。 ④汪锋、王士元:《语义创新与方言的亲缘关系》,《方言》2005年第2期。 ⑤朱德熙:《在中国语言和方言学术讨论会上的发言》,《中国语文》1986年第4期。 ⑥王洪君:《兼顾演变、推平和层次的汉语方言历史关系模型》,《方言》2009年第3期。 ⑦王洪君:《兼顾演变、推平和层次的汉语方言历史关系模型》,《方言》2009年第3期。 ⑧王洪君:《文白异读和叠置式音变——山西闻喜方言文白异读初探》,《语言学论丛》第17辑,北京:商务印书馆,1992年版。 ⑨陈保亚、何方:《核心词原则和澳越语的谱系树分类》,《云南民族学院学报(哲学社会科学版)2002年第1期。 ⑩李荣:《官话方言的分区》,《方言》1985年第1期。 (11)钱曾怡主编:《汉语官话方言研究》,济南:齐鲁书社,2010年版,第269~272页。 (12)熊正辉:《官话区方言分tstsr的美型》,《方言》1990年第1期。 (13)邓晓华、王士元:《苗瑶语族语言亲缘关系的计量研究——词源统计分析方法》,《中国语文》2003年第3期。 (14)Morris Swadesh,Lexico-Statistic Dating of Prehistoric Ethnic Contacts:With Special Reference to North American Indians and Eskimos Proceedings of the American Philosophical Society,1952,Vol.96,No.4. (15)Morris Swadesh,Lexico-Statistic Dating of Prehistoric Ethnic Contacts:With Special Reference to North American Indians and Eskimos,Proceedings of the American Philosophical Society,1952,Vol.96,No.4. (16)Morris Swadesh,Towards Greater Accuracy in Lexicostatistic Dating,International Journal of American Linguistics,1955,Vol.21,No.2. (17)陈保亚、汪锋、何方、陈泽浩:《论澳越语的语缘关系及其谱系分类》,《汉藏语同源词研究(四)》,丁邦新、孙宏开编,南宁:广西民族出版社,2011年版。 (18)徐通锵:《历史语言学》,北京:商务印书馆,2008年版,第462~465页。 (19)陈保亚、木镜湖:《南传上座部佛教入滇考》,《东南亚文化论》,昆明:云南大学出版社,1994年版。 (20)陈保亚、李子鹤:《核心词自动分阶的一种计算模型——以纳西族玛丽玛萨话为例》,《云南民族大学学报(哲学社会科学版)》2012年第5期。 (21)陈保亚、汪锋:《论核心语素表的确定——以上古汉语为例》,《语言学论丛》第33辑,北京:商务印书馆,2006年版。 (22)陈保亚、何方:《汉台核心一致对应语素的有阶分析》,《汉藏语同源词研究(三)》,丁邦新、孙宏开编,南宁:广西民族出版社,2004年版。 (23)陈保亚:《论语言接触与语言联盟——汉越(侗台)语源关系有解释》,北京:语文出版社,1996年版,第205~228页。 (24)陈保亚、何方:《略说汉藏语系的基本谱系结构》,《云南民族大学学报(哲学社会科学版)2004年第1期。 (25)汪锋、陈保亚:《语言关系、文化关系,语言文化探索乐无比:西南边疆语言与文化专家访谈录之七“陈保亚专访”》,《百色学院学报》2013年第3期。 (26)陈保亚、陈泽浩:The Genetic Classification of Kam-Tai:A Method from Similarity Matrix to Phylogenetic Tree,《永远的POLA:王士元先生七秩寿辰论文集》,台北:“中央”研究院语言研究所,2005年。严格词源统计与共享创新_方言论文
严格词源统计与共享创新_方言论文
下载Doc文档