ASJP模式的汉语方言计算分析-以65个汉语方言语档为例论文

ASJP模式的汉语方言计算分析
——以65个汉语方言语档为例

[丹麦]索伦·维希曼^1，3，冉启斌^2，3

（1.莱顿大学语言学中心，荷兰莱顿 2300；2.南开大学汉语言文化学院，天津 300071；3.北京语言大学语言资源高精尖创新中心，北京 100083）

摘要：通过对直接以IPA转写进行距离计算、转写为ASJP码后进行计算、转写为修订版ASJP码进行计算的比较，发现采用修订版ASJP码后的计算效果最符合汉语方言的实际表现。同时，还分析了65个汉语方言语档的系统发育树和系统发育网络，结果显示：东北官话与闽方言之间的亲缘关系最远，处于其间的依次是西北官话、西南官话、北方官话/中原官话、晋方言、客赣徽湘等方言、吴方言、粤方言；客赣徽湘等方言过渡性特征明显；汉语方言中接触表现突出，闽方言和吴方言内部接触相对少一些，北方方言和过渡性方言的内部接触非常多。

关键词：汉语方言；词汇距离；计算分析；系统发育树；系统发育网络

一、引言

ASJP（相似性自动判断程序，Automated Similarity Judgement Program）数据库是马普研究院建立的大型跨语言关联数据（Cross-Linguistic Linked Data）资源库之一。ASJP数据库收录每种语言至少40个核心词的语音形式，用以进行词汇语音形式相似度的计算判断。最新版数据库（第18版）收集有世界范围7655个语档（doculect）的材料，按ISO639-3编码，这7655个语档涉及全球5067种语言（https://asjp.clld.org/）。

通过列文斯坦编辑距离（Levenshtein Distance）可以计算任意两个字符串之间的距离，从而也就可以计算语档词汇的语音形式之间的距离（简称“词汇距离”）。ASJP网站提供有各类计算工具和程序。Müller（2009a，2009b，2010，2013）先后计算绘制了多个版本的世界语言语档系统发育树图，为研究语言的分化与分类提供了新的视角。

第18版ASJP数据库中收集了包括上古汉语、中古汉语、东干语在内的19个与汉语有关的语档材料。相对于丰富的汉语方言资源，19个语档的数量并不大。同时，使用ASJP计算方法对汉语方言进行研究其有效性如何，在计算的一些具体细节上是否有进行调整的空间等，都是值得研究的问题。本文采用ASJP的计算模式和方法，对初步收集到的65个汉语方言语档材料进行计算分析。

二、研究材料与方法

（一）研究材料

在以往研究中，研究者采用编辑距离对不同的材料进行距离测算的有王璐（2014），江荻（2017），赵志靖、江荻（2018）等。王璐（2014）以30个三音节词、20个句子的语音转写，测量吴方言5个方言点之间的距离。江荻（2017）通过计算核心词编辑距离及词汇相似度，对195种藏缅语族语言进行自动分类。赵志靖、江荻（2018）则对侗台语族语言进行计算分类以及亲缘关系程度的描述。

本文研究材料为65个汉语方言点各40个核心词的语音形式。各方言点具体参见附录1“65个汉语方言语档名单”。这些语档涉及官话、晋、吴、赣、湘、徽、粤、闽、客家等方言点。各语档核心词的国际音标（IPA）标写来源于《汉语方言词汇》、刘俐李等《现代汉语方言核心词·特征词集》以及各地方言调查报告、方言志、地方方言研究等。限于篇幅，每个语档的具体来源从略。目前ASJP模式的距离计算主要处理字符串之间的距离，因此各语档的IPA转写不包括声调。按ASJP数据库的模式，各个语档的信息除40个词的语音形式外，还包括各语档的ISO639-3代码（如该方言有的话）以及该方言点所在地的经纬度等信息。

（二）研究方法

按ASJP模式的做法，通常将40个核心词的IPA形式转换为ASJP码。这样做的目的主要是使软件程序能够对词的语音形式进行计算。IPA与ASJP码的对应情况如附录2所示（前面部分为元音，后面部分为辅音）。出于探索的目的，本文先报道直接依据40个核心词IPA进行计算的结果；再报道转换为ASJP码后的计算结果。

计算与作图的有关情况如下：首先使用ASJP有关软件程序计算各语档之间的词汇距离，可以形成距离矩阵。ASJP模式的距离计算有LDN距离（归一化莱文斯坦距离）、LDND距离（归一化莱文斯坦距离商）的不同（可参看冉启斌、索伦·维希曼，2018：52～53），本文研究均依据LDND距离。在距离矩阵基础上使用分子生物学软件MEGA7与SplitsTree4分别绘制模拟的汉语方言系统发生学树图（phylogenetic tree，或称系统发育树，使用Neighbor-Joining Tree法）和系统发生学网络图（phylogenetic network，或称系统发育网络，使用NeighborNet法），并进行相关分析。

三、汉语方言语档系统发育树分析

（一）依据IPA标写直接进行距离计算

由于收集到的汉语方言记音材料存在不统一之处，后期我们对少部分记音符号进行过局部统一。使用前述语料和方法，依据65个汉语方言语档的IPA直接进行距离计算，形成距离矩阵，并使用MEGA绘制出65个汉语方言语档的系统发生学树图。具体如图1所示：

关于本组80例患者的扫描诊断情况，如表1所示。多层螺旋CT与MRI检查肺动脉栓塞显示率均为100%，图像质量较高，且多层螺旋CT扫描时间短于MRI（P＜0.05）。

图1 直接按IPA计算的65个汉语方言语档系统发生学树图① 湖南省的桂阳与贵州省的贵阳拼音相同，桂阳西南官话和土话并用。为显示区别，图中“桂阳”标示为“XIANG GUIYANG”，特此说明。下同，不另注。

在系统发育树上，根节点之下以吴方言、粤方言为主的方言语档首先与其他方言语档分开；然后银川、阳江分布在一个节点之下，与其他方言语档分开；再后官话方言、闽方言、吴方言等分布在一个节点之下，与其他语档分开（进一步的分支节点还有很多，为避免繁复此处从略）。显然这个发生学关系不符合我们关于汉语方言历史的基本认知，且不少距离较远的方言语档在发生学关系上混杂在一起。

大剂量甲氨蝶呤治疗儿童急性淋巴细胞白血病后的不良反应及血药浓度监测…………………………………………………………………… 李静，等(4):431

进行计算分析的结果。直接使用方言语档的IPA转写进行距离计算效果并不理想，使用修订版的ASJP码

系统发育树里末端节点分化关系显示比较好的可能是上海、苏州。上海话与苏州话处在同一个节点下。事实上上海话和苏州话的关系也确实很近，按《中国语言地图集》它们同属吴方言太湖片苏沪嘉小片。不过，上海话的枝条比苏州短，表明上海话的演化程度不如苏州话。这是值得怀疑的。另外，和上海、苏州同属苏沪嘉小片的崇明却分布在较远的节点和分支之下。其他的几个方言语档，如黎川（赣方言抚广片）、南昌（赣方言昌靖片），寿光（北方官话沧惠片）、阳谷（中原官话），建瓯（闽北方言）、厦门（闽南方言）等，也连接在同一个直接节点上，只能算大致符合认知。

总之，按65个汉语方言语档的IPA直接进行距离计算，得到的系统发育树从整体来看是非常混乱的。对方言语档进行IPA标写理应精确度很高，但得到的计算结果反而与汉语方言的事实相距很远。这可能是因为，词汇转写精确度过高造成一些相似的语音之间距离过大，从而不利于展现方言语档真实的距离。换言之，为更好地体现语档之间的距离，词汇的转写需要将一些划分过细的语音进行合并，进行一定程度的模糊化处理。

（二）转换为ASJP码进行距离计算

我们将65个汉语方言语档转换为ASJP码进行距离计算，得到系统发生学树图。具体如图2所示：

图2 按ASJP码计算的65个汉语方言语档系统发生学树图

图2显示65个汉语方言语档在根节点上首先分化开来的是6个闽方言语档与其他语档；而在其他语档中，粤、客家、赣等方言语档分布在一个节点之下，其余方言分布在另一个节点之下；在进一步的分化关系中，客家、赣、湘等方言分布在1个节点之下，其余方言分布在另一个节点之下（进一步的分支节点还有很多，此处不再详细描述）。

将图2与图1进行比较，可以看到汉语方言系统发育树得到了很大改进。首先，无论是根节点还是分支节点，其下的方言语档分布大多符合通常对汉语方言的认知。例如5个粤方言语档（开平、阳江、东莞、广州、南宁），6个吴方言语档（苏州、上海、崇明、宁波、杭州、丹阳），3个西南官话语档（贵阳、成都、武汉），3个西北官话语档（西宁、兰州、乌鲁木齐），都分布在相同的分支节点之下。其次，系统发育树显示的部分汉语方言分化演化关系大致符合事实。例如在系统发育树的根节点上闽方言首先与所有其他方言分开，而通常认为闽方言确实是最早从共同语分化出去的。图2显示粤、客家、赣等方言从共同语分化出去的时间也比较早，这也与事实相距不远。

江西铜业集团的德兴铜矿对含硫废石采用微生物浸出—溶剂萃取—电积方法，每年回收硫精矿1 000 t，铜9.2 t，金33.4 kg，产值达1 300多万元，铜、金和银的回收率分别为86.60%、62.32%和65.09%[26]；大冶有色公司丰山铜矿对尾矿采用重选—浮选—磁选—重选联合工艺再选，得到铜精矿、铁精矿、硫精矿，其品位分别为Cu 20.5%、TFe 55.61%和S 43.61% [27]。

当然，图2的系统发育树也有一些地方与通常对汉语方言的认知存在差异，例如林州（晋方言）和合肥（官话方言）、太原（晋方言）和扬州（官话方言）分别连接在了同一个末端节点上。此外，银川与其他方言分布在了一起，而不是与兰州、西宁、乌鲁木齐等西北方言连接在一个节点上。

从图2的系统发育树还可以看到这一特点：很多方言语档的系统演化关系与这些语档的语音近似有关。例如属于东北官话的哈尔滨不是与同属东北官话的沈阳连接在同一个节点上，而是与属于胶辽官话的荣成并进一步与北京分布在一起。这应该是与三地的语音比较接近有关（哈尔滨话的音系和北京话非常接近）。语音近似的语档有时在方言分区上有不同的归属，但由于地理位置接近它们也会分布在相同的节点之下。例如属于北方官话的济南与属于中原官话的徐州连接在相同的节点之下，应该与地理接近从而造成语音近似有关。类似的情况还有属于赣方言的萍乡和属于客家话的于都等。关于系统发育树反映的语音近似因素，下文还要进行讨论。

（三）转换为修订版的ASJP码进行距离计算

四年之后，也就是2000年年底，学区王书记又一次找到我谈起工作调动的事情，我意识到自己又将迎来一次新的机遇与挑战。

对比图3和图2，可以看到两种树图既存在某些一致性，也表现出不少差异。在根节点和第二层节点下方言语档的分布是完全一致的，差别主要出现在更低层次的节点上。第三层节点下的方言分化不太相同，图3的该节点下由吴、湘、徽、客家、赣方言等共11个语档与其他方言分化开，比图2中的客家、赣、湘、官话等4个语档合理。图2的系统发育树中林州（晋方言）与合肥（官话）在一个节点下，这比较令人费解；而在图3中合肥（官话）与南京（官话）在一个节点下，这更符合汉语方言事实。图3中4个晋方言语档具有共同的上位节点，显然也更加合理。图3的系统发育树还有一些细微的改善，如同属北方官话沧惠片的利津和寿光在同一个末端节点下，而图2中和利津在同一个末端节点的是德州，然后才和寿光拥有共同上位节点。

总之，对ASJP码进行修订后计算结果是有一定程度改善的，下面按照图3的汉语方言系统发育树进行分析。其中图2与图3有部分相同的内容，上文已经提及，后面不再赘述。

图3显示，在汉语方言语档关系上，以沈阳、哈尔滨等为代表的东北官话与闽方言在方言历时发展中演化分歧时间最长，亲缘关系最远。Szeto et al（2018）通过系统发育树分析认为，汉语方言中差别最大的是安多语言联盟（Amdo Sprachbund，如临夏、西宁的汉语方言）与最南方的汉语方言（如粤语、平话等）。我们的结论与此不同。以东北官话为参照，汉语方言大致按粤方言、吴方言、客赣徽湘等方言、晋方言、北方官话/中原官话、西南官话、西北官话的顺序，亲缘关系逐渐接近。Szeto et al（2018）主要研究官话方言的类型特征，收集的是42种汉语方言的材料（以官话方言为主，占26种。这一研究后文还要再说明），可能本文分析的结果更为可靠一些。

图3 按修订版ASJP码计算的65个汉语方言语档系统发生学树图

汉语方言中闽方言在根节点下与其他方言分离开，其他方言可以认为主要代表共同语系列。闽方言自身的特征最统一突出，因此自成一类。粤方言、吴方言自身的特征比较统一突出，基本上能够形成一类。以粤方言为主也包括少数客家、赣方言是第二层次从共同语分化出来的。再次是以吴方言为主也有少数湘、徽、赣、客家方言从共同语分化出来。再往下的层次就比较细碎了。

从系统发育树上来看，赣方言、客家话、湘方言、徽方言等自身特征独立性差，往往交错穿插在其他方言之中，呈现出明显的过渡性特征。

ASJP码是通用于世界语言语档的编码方式。在汉语方言的IPA记音中，还广泛出现一些有特色的语音或音标，例如元音方面的舌尖元音[ɿ]、[ʅ]，圆唇元音[y]等；辅音方面的舌尖后音[ʂ]、舌面擦音[ɕ]等。除此以外，本文研究采用的65个汉语方言语档中还出现ASJP码不能涵盖的其他8个鼻化元音。在原ASJP码中，舌尖元音均默认转换为[i]；舌尖后音[ʂ]默认转化为[ʃ]等；不能涵盖的鼻化元音则归并到相近的语音之中。这些处理会改变语档之间计算得到的具体距离数值。如果将汉语方言中的上述语音独立出来，计算出来的汉语方言系统发育树是否会进一步改善？出于探索的目的，我们对ASJP码进行了一定程度的修订，修订的ASJP码如附录3所示。同时，为方便汉语方言的计算，在本研究中，塞擦音、送气音、儿化音等均按照2个音素处理① 按照LDND距离的计算原理，如将单一音素改变为两个音素，得到的距离数值会略微减小。。这样得到的65个汉语方言语档系统发育树如图3所示。

在系统发育树中，6个闽方言语档中的4个闽南语档（雷州、潮州、海口、厦门）分布在相同的节点之下，闽北的建瓯和闽东的福州分布在一起。粤方言中阳江和开平分布在一个节点之下，然后依次是东莞、广州、南宁。这些都显示出系统发育树较好的分化效果。

从系统发育树中还可以看到语音的相似性在语档分化中的重要作用。例如同属于湘方言的长沙话（新湘方言）和娄底（老湘方言）没有分布在一起，而是插入到其他方言中。长沙插入到以西南官话为主的分支之下，显然与长沙话的语音和西南官话近似有关；娄底则插入到吴方言为主的分支之下，也是出于娄底话语音与吴方言语音接近的原因。地理上接近造成语音相似的语档也会分布在相同节点之下，例如山东省内的10个语档本来分属北方官话、中原官话和胶辽官话，但在系统发育树中则分属以中原官话和东北官话为主的两个节点之下。

四、汉语方言语档系统发育网络分析

上文从系统发育树的角度分析了65个汉语方言语档的分化发展情况。在语言或方言的实际发展变化过程中，除了纵向的亲缘分化关系外，语言或方言之间还经常发生横向接触与相互影响，这是系统发育树所不能反映的。分子生物学中通过构建“系统发育网络”来展现复杂的网状进化事件，以表现基因的横向转移、杂交、基因重组等现象（程春花、黄原，2008）。在语言或方言的发展研究中，也可以运用系统发育网络来观察语言或方言之间的复杂关系，已有学者将其应用于藏缅语研究（邓晓华等，2015）和汉语方言研究（List，2015；Szeto et al，2018）。我们依据修订版ASJP码的方言语档，使用SplitsTree绘制出65个汉语方言语档系统发育网络，如图4所示：

图4 按修订版ASJP码计算的65个汉语方言语档系统发生学网络图

List（2015）绘制过10个汉语方言点的分裂网络图，但它的数据量较小，也没做深入的分析。Szeto et al（2018）采用包括音系、形态句法、语义、语法化模式等方面的21个类型学特征，依据42个汉语方言变体（其中官话方言26个，非官话方言16个）的类型特征矩阵制作汉语方言的类型网络图。Szeto et al（2018）的42个方言中有28个与本研究相同，因此，下文对图4作的说明分析也参照Szeto et al的研究进行。

八边形密码的情况个数大约为普通3*3式密码的1.65倍，占据屏幕空间则略大于3*3式密码，约为3*3式密码的1.45倍。普通3*3式密码在占用空间和安全程度上均比无中心一点的正三角形式图形密码要占优势。等腰直角三角形式密码占据屏幕空间大，且密码的安全程度均低于上述几种，即使在宽屏设备上使用也没有高安全性。

系统发育网络图虽然不是十分清楚，但大致可以看到一些方言语档聚集成簇，这实际上反映了方言群的聚合情况。其中，比较明显的同质性较低的方言群有闽方言、吴方言和粤方言；同质性较高的方言群有西南官话、兰银官话等。曹茜蕾（Chappell，2015）曾从体标记、被动结构和差比结构等三种语法结构考察汉语方言，指出中国境内至少可以分为五个主要的方言区域。五个方言区域分别是：北方区域，中部过渡区域，西南区域，南方远端区域，东南区域。但这种划分在图4的系统发育树上得不到体现。图4中很多方言语档的分布并不成明显的簇状，反映出这些方言混合和过渡的特征较多。曹茜蕾（Chappell，2015）依据客观的语言事实，在区域划分时还是以人为定性为主，因此，可以将“中部过渡区域”独立出来。而纯粹客观的数据计算，具有过渡特征的方言在分化网络上就会分散开来。这应该是本文研究结果与曹茜蕾存在差异的原因。

图4的系统发育网络图中存在很多盒状的网格，这是由于语言特征里包含了不少冲突信息造成的。所谓“冲突信息”，是指演化关系中出现了和单纯的纵向遗传不相容的信息。换言之，出现冲突信息表明语言关系中除了纵向的线性遗传关系外，还存在横向的传递和接触关系。如果网络图中没有冲突信息，语言关系就会呈现为一棵辐射树。我们按《中国语言地图集》的方言分类，利用ASJP的软件工具绘制了65个汉语方言语档系统发育示意图。具体如图5所示：

福克斯以斯迈斯的受众商品论和受众劳动概念为理论核心，在借鉴马克思物质劳动理论基础上，批判了基于非物质劳动概念的数字劳动理论，提出了自己的数字劳动理论。

同时可以看到，有的方言语档连接在相同的直接节点上，说明它们应该是直接分化形成的；然而事实上它们并不具有很近的分化关系。例如萍乡和北京，很难想象萍乡话和北京话具有最直接的分化来源。类似的还有南通、沈阳，徐州、福州，银川、阳江，扬州、筠连等。它们的关系相对较远，却连接在相同的直接上位节点上。

图5 依据《中国语言地图集》方言分类的65个汉语方言语档系统发育示意图

和图4进行对比可以看出，图5中汉语方言之间只有单一的线性分化关系，没有横向相互接触和影响的信息。事实上汉语方言在历史发展过程中有大量的接触事实存在。李如龙（2016）指出：“只有演化的考察是不够的，因为方言的形成和发展绝不像从树干上长出树枝那么简单。汉语方言的形成大多是多来源混合、多层次叠加的。”图5显示的汉语方言关系只是根据汉语方言当代共时层面绘制的演化示意图。而图4是根据方言间的冲突信息得到的系统发育网络图，能够显示汉语方言语档之间的接触和相互影响。从图中可以看到，总体来说闽方言和吴方言相互接触和影响少一些；北方方言和一些过渡方言相互接触和影响更多。此外，图中还显示出黎川话和南昌话相互的接触与影响非常突出。

在图5中，官话方言分布在整个辐射树的上半部。而在图4中，如果以系统发育网络图的中心为圆心，官话方言的分布从桂林到南通，几乎跨越了大半个圆周。官话方言跨域具有如此大的范围，显然受到了大量接触的影响。Szeto et al（2018）认为，不同地区的官话方言由于接触的作用发生了很多变化，类型特征很不相同，并且远不是同质的。这无疑是符合汉语方言事实的。

需要指出的是，图5中由于晋方言独立为一种方言，分布在了南方方言的区域之中。这显然看起来有一些不伦不类。而在图4中，晋方言是归入到北方方言的整体区域内的。这表明晋方言的总体特征仍然是属于北方方言的，系统发育网络对此有更准确的反映。Szeto et al（2018）认为，晋方言虽然像南方方言那样保留了某些古代汉语的语音特征，但从语义和形态句法特征进行计算，它仍然属于北方方言。我们认为晋方言在语音上也不像南方方言那样保留古代汉语的语音特征。本研究依据的是方言词汇的语音形式之间的距离，在图4的系统发育网络图中，晋方言事实上分布于北方方言内，这表明晋方言的词汇语音形式总体是属于北方方言的。

在Szeto et al（2018）的研究中，一些南方官话，例如九江和柳州，不是从语言的本质属性上归入到北方方言簇中，而是从地域上归入到南方方言簇内。本研究中，柳州处于北方方言与南方方言之间的过渡位置，并靠近南方方言。这也是方言接触的一种反映。

宝儿康散是用于治疗小儿腹泻病的临床经验方，由广东宏兴集团股份有限公司宏兴制药厂生产的中成药，临床应用广泛。为了评价宝儿康散治疗小儿急性水样腹泻病（脾虚湿困证）的有效性和安全性以及探索适宜的儿童剂量，由16家医疗机构对该药进行了上市后再评价临床研究。在临床研究开始之前，本试验方案获得了临床研究负责单位天津中医药大学第一附属医院医学伦理委员会的批准（TYLL2013［Y］字023）。

五、结语

我们报道了使用ASJP的方法和工具对汉语方言

最后，教师注重提高自身的专业素养，这里的专业素养既包括了教学的专业技能，也包括了班级管理能力，对于自身的专业素养并不是一朝一夕可以练就的，它需要长期的探索学习和实践总结才能得到提高。教师可以多观摩一些优秀教师的课堂，借鉴他们的管理方法，也可以多参加专门的专业素养讲座或培训，不断的给自己充电。

此外，有的语档处在相同的末端节点，表明它们应该具有很密切的亲缘关系；而汉语方言的事实证明它们的发生学关系并不近。例如绩溪和大同处在同一个末端节点之下，事实是绩溪话和大同话无论在方言归属还是地理上都距离较远。类似的还有温州和长沙，娄底和开平等。

进行距离计算效果最好。系统发育树和系统发育网络对汉语方言的内在特征有很好地展现，尤其是对于方言演化的历史进程、方言之间的互相接触与影响，系统发育方法能够提供客观的信息和富于启示的参照。鉴于目前使用系统发育分析方法对汉语方言所做的研究还不太多，我们认为这一方法值得继续使用和推广，以探索它对汉语方言研究的价值和意义。汉语方言资源丰富，能够收集到的语档数量很多。我们将在更多语档数量的基础上展开计算分析，希望能够有更多的发现和收获。

（梁煜珠、孙越、许可、吴丹丽等不同程度地协助了汉语方言数据的收集整理，在此表示感谢！）

附录1 65个汉语方言语档名单

北京，哈尔滨，沈阳，济南，阳谷，汶上，聊城，

此外，本研究结果提示，经济水平影响到农村居民对自身抗风险能力的评估。在社交网络萎缩的现实情境下，任何(未知的)疾病、意外等突发事件都可能成为农村居民的心理威胁及负担，而富足的经济基础将极大地增加农村居民的生命风险抵抗能力，同时他们能更容易获得物质层面的满足，农村居民会更有“底气”的面对未来生活。相反，较低的经济水平无法赋予农村居民物质满足感与心理安全感。在隔离情境下，低经济水平的农村居民极有可能产生“无依无靠”的消极认知，这将影响他们对生存质量的评价。

(1)数据选择方面。试验采用6月的光谱数据的成像，由于在该时相下植被生长良好，对于多源数据中表观植被的部分(NDVI，EVI等)数据分布良好，特征比较明显，但是由于植被在这个时相下生长旺盛、枝叶繁密，对土壤表面有大面积的覆盖影响，从而导致土壤亮度等数据分布偏离正常值。因此利用多源数据，结合时间分辨率和空间分辨率更高的数据，并且综合考虑土壤分类的多方面因子，才能提高土壤分类的精度。因此合理的选择数据是影响分类精度的重要因素之一。

牟泽雄：在当前的书法欣赏与教学中，存在一种技术化的倾向。将整体性的书法看成是笔法、结构、章法、墨法等技术性手段的叠加。对传统经典法帖的解读与示范大都是做表面化、技术化，忽略了传统经典法帖背后复杂而丰富的时代背景、文化内涵、个人阅历、个性趣味，导致对传统书法观念上的误解。在实践中就常常会出现林散之先生批评的“满纸纷披夸独能，春蛇蚯蚓乱纵横”式的胡乱的“创新”和过度的“制作”等误区。你对这个问题怎么看？在你看来，书法技术化的原因是什么？在教学上我们是否能找到一种更好的办法和方式？

图4显示，汉语方言系统发育网络右上部分以南方方言为主，左下部分以官话方言（也包括晋方言）为主。南方方言总体来说枝条长度更长，表明南方方言在整个汉语方言里距离更远，同质性低，差异更大，其中可以明显看出闽方言差异最大；官话方言总体来说枝条长度较短，表明官话方言在整个汉语方言里距离较近，同质性高，差异较小，其中可以明显看出北方官话石济片（济南、徐州、德州）差异最小① 必须说明的是，这是仅就本文研究的65个方言语档而言。。Szeto et al（2018）指出北方方言之间的平均差异（13.9%）远小于南方方言之间的差异（34.5%），本文研究的结论也支持这一观点。

罗山，西安，兰州，银川，西宁，乌鲁木齐，成都，

筠连，贵阳，昆明，大关，徐州，武汉，南京，

寿光，德州，利津，荣成，万荣，牟平，洛阳，

扬州，南通，合肥，桂林，柳州，太原，林州，

大同，忻州，长沙，娄底，桂阳，南昌，萍乡，

黎川，绩溪，上海，崇明，丹阳，金华，宁波，

基于上述背景，笔者开展了新型职业农民培养模式的实践研究，并与农业园区开展院区结对开展田间课堂教学、农民社区学院网络体系建设，与太仓市政府合作创建青年职业农民定向培养班[1]。经研究和探索实践，不断明确培养目标、体制机制、教学体系和培养路径，逐步形成了“校地联动、教产衔接、开放共享、终身学习”新型职业农民定向培养的苏南模式。

杭州，苏州，温州，福州，厦门，潮州，雷州，

建瓯，海口，广州，阳江，南宁，东莞，开平，

梅县，于都

附录2 ASJP码与IPA对应表

（1）元音部分

（2）辅音部分

附录3 修订的ASJP码与汉语方言记音音标对应情况

特征提取即对某一模式的组测量值进行变换，以突出该模式具有的代表性特征的一种方法。常见的文字特征类型分为统计类特征和结构类特征，统计类特征有像素点个数、灰度值统计类别等，而结构特征是如边缘、角、区域、脊等代表性特征。

（1）汉语方言记音音标与修订版ASJP码对应表

（2）汉语方言鼻化元音归并情况

参考文献：

[1]北京大学中国语言文学系语言学教研室.汉语方言词汇[M].北京:文字改革出版社,1964.

[2]程春花,黄原.系统发育网络的构建与应用[J].昆虫分类学报,2008,（3）.

[3]邓晓华,杨晓霞,高天俊试论语言演化网络——以藏缅语为例[J].语言研究,2015,（3）.

[4]江荻.藏缅语谱系的自动分类实验[A].《中国民族语言学报》编委会.中国民族语言学报（第一辑）[C].北京：商务印书馆,2017.

[5]李如龙.演化与接触，系统与特征——再论汉语方言的比较研究[J].国际汉语学报,2015,（1）.

[6]刘俐李,王洪钟,柏莹.现代汉语方言核心词·特征词集[M].南京:凤凰出版社,2007.

[7]冉启斌,索伦·维希曼.怎样区分语言与方言——基于核心词汇的距离计算方法探索[J].语言战略研究,2018,（2）.

[8]王璐.语言距离与吴语互通度[D].上海:华东师范大学博士学位论文,2014.

[9]赵志靖,江荻.侗台语族语言的编辑距离分类[J].计算机工程与应用,2018,（19）.

[10]Chappell,Hilary.Linguistic areas in China for differential object marking, passive, and comparative constructions[A].In Hilary Chappell(ed.), Diversity in Sinitic languages[C].Oxford:Oxford University Press,2015.

[11]List,Mattis.Network perspectives on Chinese dialect history[J].Bulletin of Chinese Linguistics, 2015,(8).

[12]Müller, André, Viveka Velupillai, Søren Wichmann,Cecil H.Brown, Pamela Brown, Eric W.Holman,Dik Bakker, Oleg Belyaev, Dmitri Egorov, Robert Mailhammer, Anthony Grant, and Kofi Yakpo.ASJP World Language Tree: Version 1.2009.

[13]Müller, André, Viveka Velupillai, Søren Wichmann,Cecil H.Brown, Pamela Brown, Eric W.Holman,Dik Bakker, Oleg Belyaev, Dmitri Egorov, Robert Mailhammer, Anthony Grant, and Kofi Yakpo.ASJP World Language Tree of Lexical Similarity:Version 2.2009.

[14]Müller, André, Søren Wichmann, Viveka Velupillai,Cecil H.Brown, Pamela Brown, Sebastian Sauppe,Eric W.Holman, Dik Bakker, Johann-Mattis List,Dmitri Egorov, Oleg Belyaev, Robert Mailhammer,Matthias Urban, Helen Geyer, and Anthony Grant.ASJP World Language Tree of Lexical Similarity:Version 3.2010.

[15]Müller, André, Viveka Velupillai, Søren Wichmann,Cecil H.Brown, Eric W.Holman, Sebastian Sauppe,Pamela Brown, Harald Hammarström, Oleg Belyaev,Johann-Mattis List, Dik Bakker, Dmitri Egorov,Matthias Urban, Robert Mailhammer, Matthew S.Dryer, Evgenia Korovina, David Beck, Helen Geyer,Pattie Epps, Anthony Grant, and Pilar Valenzuela.ASJP World Language Trees of Lexical Similarity:Version 4.2013.

[16]Szeto, Pui Yiu, Umberto Ansaldo, Stephen Matthews.Typological variation across Mandarin dialects: An areal perspective with a quantitative approach[J].Linguistic Typology, 2018, (2).

A Phylogenetic Study on 65 Chinese Doculects: with ASJP Tools

[Denmark]Søren Wichmann¹，Ran Qibin²
（1.Researcher of Linguistic Center ，Leiden University ，Leiden 2300 ，Holland ；Beijing Advanced Innovation Center for Language Resources ，Beijing 100083 ，China ；2.College of Language and Culture, Nankai University ，Tianjin 300071 ；Beijing Advanced Innovation Center for Language Resources ，Beijing 100083 ，China ）

Abstract: Distances of 65 Chinese doculects are analyzed with the ASJP tools.Calculating results show that the phylogenetic tree based on modified ASJP codes is better than that based on IPA or ASJP codes.Through the analysis of phylogenetic tree and phylogenetic network, the main conclusions are as following: the relationship between Northeast Mandarin and Fujian dialect is the farthest, among which the order is Northwest Mandarin, Southwest Mandarin, North Mandarin/Central Plains Mandarin, Jin dialect, Hakka/Gan/Hui/Xiang dialect, Wu dialect and Cantonese;Hakka, Hakka/Gan/Hui/Xiang dialects have obvious transitional characteristics; The contact between Min dialect and Wu dialect is more prominent than that between northern dialect and transitional dialect.

Key words: lexical distance；Chinese dialect；quantitative approach；phylogenetic tree；phylogenetic network

基金项目：北京语言资源高精尖创新中心项目“语言识别理论及语言数量统计的方法论研究”（KYR17018）子课题“基于词汇距离计算的语言分类研究”

作者简介： 1.索伦·维希曼，男，莱顿大学语言学中心研究员，北京语言大学语言资源高精尖创新中心兼职研究员，语言学博士；

2.冉启斌，男，南开大学汉语言文化学院教授，博士生导师，北京语言大学语言资源高精尖创新中心兼职研究员，文学博士。

标签：汉语方言论文; 词汇距离论文; 计算分析论文; 系统发育树论文; 系统发育网络论文; 莱顿大学语言学中心论文; 南开大学汉语言文化学院论文; 北京语言大学语言资源高精尖创新中心论文;