连江市广东客人词汇相似性的计量分析_廉江论文

廉江市粤客词汇相似度的计量分析,本文主要内容关键词为:廉江市论文,词汇论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一 廉江方言分布和概况

广东省廉江市位于雷州半岛北部,粤桂两省交界处,西北与广西壮族自治区的博白、陆川等县接壤,东北是广东化州市(属茂名市),南界广东遂溪县(属湛江市),西南濒临北部湾。廉江在秦朝属象郡;汉代属合浦郡;唐高祖年间一度改名为“罗州”,故亦有“古罗州”之称;宋太祖废罗州归入化州,孝宗年间置石城县(仍属化州府),以后直至明清皆以石城名之;明洪武年间化州撤府划属高州府,石城亦随之;民国初改石城名为廉江县,属高雷道;新中国成立后属广东省湛江专区。

廉江市境内主要有三种汉语方言:白话、话、黎话。据民国时期所修的《重修石城县志》上记载:“县之语言有三种:一曰客话……多与广州城相类;二曰哎话……与嘉应州相类……;三曰黎话……与雷州相类”。其中所谓“客话”即今“白话”,属粤方言,主要分布于廉城、安铺、石城、平坦4个镇及良垌、新华、新民、吉水、营仔各镇的大部分地区,多集中在廉城的南部和东部,使用人口据《廉江县志》(1994)的统计有约30万。廉江客家话(本地称“哎话”,或写作“话”)聚集在北部和西部的山区地带,如塘蓬、石颈、和寮、石角、长山等5个镇,以及河唇、石岭、青平、高桥、雅塘、营仔、吉水的部分村庄,使用人口约50万;廉江的黎话(旧志作“雷话”)主要分布于西南与遂溪接壤的横山、河堤、龙湾3个镇,及新民、新华、良垌、石城、营仔等地的少数乡村,使用人口约20万。

廉江方言的分布在粤西高雷地区具有一定的代表性:闽、粤、客三大方言并驾齐驱,其中闽方言相对较少受其他方言影响(粤西闽语多集中在沿海一带),粤、客方言则因地缘上比邻而居、语言沟通较易等原因而接触较深,比粤语代表广州话和客话代表梅州话之间有更多的相通相近之处。一般而言,在方言接触过程中,强势方言对弱势方言具有明显的影响作用,廉江以粤方言为强势方言,廉江客话中有相当一批词汇已偏离典型客话,而与粤语相同。例如,对于“猴子”、“蜈蚣”、“茄子”、“隔壁”、“围嘴儿”等词项,廉江客话使用的是典型的粤方言词语——“马骝”、“百足”、“矮瓜”、“隔篱”、“口水枷”,而不是像梅州客话用“猴哥”、“蜈蚣虫”、“吊菜”、“侧角”、“澜丫”。不过我们同时发现,廉江粤语中有一些词项也受当地客话的影响,如水果类词项在典型粤语中一般不带后缀,采用单纯词形式,而廉江(包括粤西其他地方)粤语却常常加后缀“子”——“桃子”、“李子”、“柿子”,与客家方言的构词形式相似。

为了更细致、更精确地研究方言之间的接触,本文以廉江为研究个例,对廉江廉城白话(下文称之为廉江粤语)和廉江石角客话(下文称之为廉江客话)的900多个日常所用词项做了计量分析。本文采用SPSS11.0统计软件计算廉江粤语和廉江客话的相关系数,并以广州粤语和梅州客话的相关系数作为参照,对比分析廉江市粤、客方言的相关性及其与典型粤、客方言的差异。

二 计量分析的方法

2.1 计量方法的回顾

运用计量手段来分析汉语方言间亲疏关系的方法,始于上个世纪80年代。郑锦全、马希文等学者最早开始了这方面的研究工作。1992年,王士元和沈钟伟合作研究出了计量方言关系的方法(简称王沈计量法,下文同),给人们提供了一种切实可行的计量方言词汇相关系数的途径。2003年陈朝珠应用王沈计量法,以北海市区方言词汇为对象,从定量的角度研究北海市与周边方言之间的关系(陈朝珠,2003)。

2.2 计量的基本方法

本文在计量廉江粤、客两方言间的相关系数时,主要采用王沈计量方法和原则,同时从词汇计量的具体情况出发,对以上方法和原则进行一些相应的补充。

王沈计量方法和原则概括如下:

1)特征选择

选择语素作为体现方言关系在词汇形式上的研究对象,以语素和词语的构成方法作为计量的要素。通过这种方法,在分析同一个词项在两种方言中的词汇表现形式时,需要分析两者的语素和构词方法来表明它们相互之间相关的程度。

2)计量公式

依照通用的Jaccard分类学的方法,方言间语素和构词法出现的情况有“双有”、“有无”、“无有”、“双无”四种,分别用:a、b、c、d代表。其中d“双无”的情况对于分析两方言间关系没有实际意义。所以得出计算词汇相关系数的公式:

a/(a+b+c)——表示两种方言词汇语素和构词法的“双有”关系和所有关系②的比值。

3)计量原则

n——两个方言中用于比较的词项的总数。

2.3 方言词汇计量细节补充说明

计算廉江粤语客话词项的相关系数时,存在一些王沈计量法中没有详细说明的问题,下面就这些问题分别讨论:

问题1 语素与构词法在计算相关系数时其关系如何?

将语素和构词法作为分析方言词汇关系的对象进行计算时,有以下五种情况出现:

情况一:比较对象的语素部分相同,构词法不同。它们相关关系的区分主要体现在构词法的不同。构词法差别越大,则相关系数越小。

情况二:比较对象的语素部分相同,构词法相同。此时比较对象的关系由语素相似比例决定。相同的语素越多,相关系数越大。

情况三:比较对象的语素和构词法完全不同,这时的相关系数等于0。k情况四:比较对象的构词法与语素完全相同,这时的相关系数等于1。k情况五:比较对象的构词法与语素皆部分相同,相关系数取决于两者的相同程度。k在这五种情况当中,情况三和情况四最为简单,情况一和情况二稍微复杂,情况五是情况一和情况二的综合,是方言词汇中占比例较多的情况。具体语素的比较过程如下:

(1)分别找出所比较的方言某个词项反映形式i和j的所有语素。

(2)如果某个语素在i和j中都有,属于2.2节提到的“双有”情况a。将此语素作为比较项,同时标记为“1”(“1”表示特征存在;“0”表示特征不存在。“特征”包括语素、构词法两方面的内容)。如果某个语素只是出现在i或j中,属于“有无”或者“无有”情况b、c,将两者所属的这些不同的语素作为比较项,对具有某语素的一方标记为“1”,不具有此语素的一方标记为“0”。

(3)按照公式1计算语素项的相关系数。

问题2 以语素为单位计算相关系数时,是否需要考虑音节?

汉语中大多数是单音节语素,此外,还有双音节语素和多音节语素,因此在计算相关系数时,理论上存在语素数目可能相同而音节数目可能不同的情况。但在邻近汉语方言的词汇计量过程中这样的情况比较少见,分析语素项的多少实际上也体现了音节数量的不同。如果将音节数作为一个独立关系来进行统计,那么将会产生重复比较的效果,使得词汇比较结果没有较好的区分度。所以在计量时不必考虑音节。具体实例分析请看本文2.4节。

问题3 同一词项的反映形式如果分别是词与词组,它们可否比较?

汉语方言中的一个词项,就是一个概念意义,词和词组都可能作为反映形式。汉语中的词和词组(又叫做“短语”)虽然有区别,但是两者界限不甚明确(袁毓林,1998:132),具有非常紧密的联系。例如,它们之间经常可以相互转化,而且合成词的构造与词组的构造类型相似。因此可以将词和词组放在一起比较。

词和词组比较时,语素之间的比较按照词与词的比较方式计算。构词法上,只统计构词法种类而不考虑构词法层次。本文不采取将词组排除在统计对象之外的方法,因为词组形式的词项,在方言词汇中占有很大的比例,地位重要,如果将这部分删去,会对计量结果的准确性产生影响。而且用以上方法能够在做方言词汇计量统计的时候分析词和词组。

问题4 如何确定构词法分析的层次?

在汉语中,词的构成形式可以分成以下几个层次:

图1 词构成的层次结构图

说明:派生中的“其他”项包括中缀、叠缀等形式

以构词法计量k词项的相关系数S[k,ij]。具体的比较过程如下:

(1)在比较词的层次结构时,由低层次开始往高层次方向进行比较。比较的次序为层次3、层次2、层次1。分析时以最小区分特征为区分点。采用这种比较方式的原因,请看2.4节第(2)部分的分析。

(2)如果在某一层次上反映形式i和j都具有某种结构,则将此结构作为比较项,双方标记都为“1”。属于2.2节中提到的“双有”情况a。

(3)如果在某一层次上反映形式i或j有某种结构,也将此结构作为比较项,具有此结构的一方标记为“1”;不具有此结构的一方标记为“0”。属于2.2节中提到的“有无”或者“无有”情况。

问题5 两种方言中同一词项的多种反映形式如何相互比较?

根据方言词汇的调查结果,一个词项在一种方言中往往有好几个反映形式。这时,计算这个词项的相关系数就不是简单的A方言的一个反映形式对应B方言的一个反映形式的比较分析。

王沈计量法中提到,由于每个词项是相对独立的,因此每个词项的相关系数应该单独求出。根据这种方法,在同一词项有多种反映形式的情况下,可以按照以下方法单独求得此词项在两种方言中的相关系数。王士元和沈钟伟文章中的1.3章提到一个假设的例子。这个例子的表述方式如下:

表1 词项和反映形式关系

词项反映形式方言A 方言B

k一1 1

二0 1

说明:1表示这个反映形式存在;0表示这个反映形式不存在,下同。

方言A中有反映形式一,而方言B中也有,得a=1。方言A中有反映形式二,而方言B无,故b=1。根据公式1可以计算得出=1/2=0.5。k当两种方言中同一词项有多种反映形式时,先找两种方言中所有的反映形式,综合考察它们的词素和构词法在两种方言中的“双有”、“有无”、“无有”的情况,然后确定a、b、c三个系数的值,最后根据公式=a/(a+b+c),从而求得这个词项中两种方言的相关系数。

问题6 方言俗字与有音无字的情况如何处理?

有些词项的反映形式是有音无字或用方言俗字来表达的。俗字是某种方言的特有用字,是某方言区的人造字。有音无字的情况可能是本字不可考,或有待考证。这时,不能从字型上来确定它们的语素是否相同,而要从音义两方面进行综合考虑。如果相比较的语素读音存在对应关系,并且意义相同或相近,那么就可以将它们作为共同语素的情况对待。例如,词项“没有”,在广州话中是“冇”,在梅州话中是“无”。从字型上看,它们是不同的语素,但是从音义对应上判断,它们应为相同的语素。

问题7 相关系数的类型有哪些?

单词项相关系数——指某个词项k中表现形式i和j的语素、构词各个比较项的相关系数总和的平均值。所比较方言的词项有多少条,就有多少个单词项相关系数。

相关系数总和——所比较方言所有单词项相关系数的总和。

平均相关系数——所比较方言中所有单词项相关系数的平均值。等于相关系数总和与总词项数的商。它体现了方言之间相似度的大小。

2.4汉语方言词汇计量举例

例一:“父亲”这个词项在廉江粤语中有“阿爸”、“老豆”、“家父”三种反映形式,而在廉江客话中只有“阿爸”一种反映形式。处理时,先将这三个形式的所有语素和构词法找出,然后看它们在两种方言中的分布情况:

表2 计量例表一

反映形式廉江粤语廉江客话

1

语素阿 1

1

2

爸 1

1

3

老 1

0

4

豆 1

0

5

家 1

0

6

父 1

0

7

音节双音节 1

1

8

构词法1 前缀1

1

9

偏正1

0

10 构词法2 合成词 1

1

11 复合词 1

0

12 派生词 1

1

13 偏正1

0

14 前缀1

1

例二:“雾”这个词项广州话有“雾”、“雾水”两个反映形式,而梅州话则有“蒙纱”、“蒙雾”两种反映形式。

表3 计量例表二

反映形式广州粤语梅州客话

1 语素雾

1

1

2 水

1

0

3 蒙

0

1

4 纱

0

1

5 音节单音节

1

0

6 双音节

1

1

7 构词法1 偏正 1

0

8 动宾 0

1

9 单音节单纯词 1

0

反映形式 广州粤语梅州客话

10构词法2 单纯词

1

0

11合成词

1

1

12复合词

1

1

13偏正 1

0

14动宾 0

1

“双有”即“1——1”的情况为a。“有无”即“1——0”的情况为b。“无有”即“0——1”的情况为c。

根据分析结果确定a、b、c的值后,由公式1计算相关系数值。

1)构词法分析比较

构词法分析方式有两种(见上述例一、例二中的构词法1和构词法2):分析方法一,是2.3节当中问题4所列的比较方式,由低层次向高层次的顺序进行比较分析;分析方法二,按照层次1、2、3的顺序依次对反映形式进行逐层比较、分析。不同分析方法得出的数据不同,见表4:

由此可见,如果使用分析方法二,从层次1往层次3进行分析,平均相关系数的值会增大,但是这种方法区分方言词汇之间差别的能力反而减小(注:由的差值对比可以知,差值大小与相关系数区别方言词汇能力大小有关。),所以我们认为采用分析方法一较为合理。

2)音节分析比较

音节的比较在2.3节问题2中进行了阐述,在以语素为单位计算相关系数时,考虑音节与否其具体区别如表5(计量时采用构词法1的比较项):

可见,如果考虑音节因素,相关系数的值会增大,但是相关系数区分方言词汇之间差别的能力并没有得到显著提高。因此在方言词汇计量中可以省略音节因素。

三 粤客词汇相关系数的计量分析

3.1 粤客词汇相关系数的计量分析材料

所用方言词汇材料来源:

廉江粤语词汇——邵慧君田野调查所得。

石角客话词汇——李如龙等(1999)《粤西客家方言调查报告》,暨南大学出版社。

广州粤语词汇——白宛如(1998)《广州方言词典(现代汉语方言大词典·分卷)》,江苏教育出版社。

梅州客话词汇——黄雪贞(1998)《梅县方言词典(现代汉语方言大词典·分卷)》,江苏教育出版社。

文中用语解释:

广粤—梅客:指广州粤语和梅州客话的对比计量。

廉粤—廉客:指廉江粤语和廉江客话的对比计量。

廉粤客—广粤:指廉江粤语和廉江客话中完全相同的词项与广州粤语的对比计量。

廉粤客—梅客:指廉江粤语和廉江客话中完全相同的词项与梅州客话的对比计量。

计量所用词项的类别分布如表6:

表6 分类号和分类项目对应表

分类号和分类项目对应表

1 2 3 4 5 6 7 8 9 101112131415

天文 地理 时间 农事 家务 动物 植物 房屋 器具 衣饰 饮食 身体 人品 称谓 婚丧

161718192021222324252627282930

疾病 起居 教育 娱乐 交际 商业 交通 动作 感知 形容 数量 指代 副词 连介 助词

“广粤—梅客”和“廉粤—廉客”使用的词项调查表词类分布见图2;“廉粤客—广粤”和

“廉粤客—梅客”词项调查表词类分布见图3。

图2 “广粤—梅客”和“廉粤—廉客”词项调查表词类分布图

图3 “廉粤客—广粤”和“廉粤客—梅客”词项调查表词类分布图

说明:横坐标数值为分类号,纵坐标为某词类占词表总词项数值百分比。

3.2 粤客词汇相关系数的计量分析步骤

1)“广粤—梅客”计量:将广州粤语与梅州客话按照词项一一对应,以Excel表的形式列出。首先以公式1计算单个词项的相关系数;最后以公式2得出所有词项的平均相关系数。

2)“廉粤—廉客”计量:将廉江石角客话与廉江粤语照词项一一对应,用Excel表式列出。首先以公式1计算单个词项的相关系数;最后以公式2得出所有词项的平均相关系数。

3)“廉粤客—广粤”和“廉粤客—梅客”计量:将“廉粤—廉客”计量结果中=100%(为某个特定的相关系数值,下文同)的词项表现形式挑选出来,分别计算这些词项与广州粤语和梅州客家话的相关系数。

3.3 计量结果比较分析

3.3.1 相关系数值的比较

1)“广粤—梅客”与“廉粤—廉客”相关系数值的比较

广州粤语与梅州客话的词汇平均相关系数是0.480;廉江粤语和客话的平均相关系数是0.557。廉江地区粤客方言的平均相关系数高于广梅的粤客方言平均相关系数,说明廉江地区粤、客方言由于接触频繁,使得其词汇的融合程度加深,它们的相关系数也因此增大。

表7 “广粤—梅客”词汇相关系数表

总词项数936

相关系数总和450.844

平均相关系数0.480

表8 “廉粤—廉客”词汇相关系数表

总词项数972

相关系数总和540.196

平均相关系数0.557

2)“广粤—梅客”与“廉粤—廉客”的词汇分级比较。

为了更深入地分析“广粤—梅客”与“廉粤—廉客”的词汇的相关度的异同,我们将900多个词项分成基本词汇和普通词汇两级。参考国内外语言学者普遍认同的斯瓦迪士200核心词,将900多个常用词进行分级,得到139个第一级基本词汇(其中部分核心词粤或客方言词表中未收)和800多个第二级普通词汇,分别将“广粤—梅客”以及“廉粤—廉客”中的基本词汇和普通词汇进行相关系数的比较分析:

表9 “广粤—梅客”词汇分级相关系数表

第一级:基本词汇第二级:普通词汇

总词项数139

802

相关系数总和63.837

388.007

平均相关系数0.4590.483

表10 “廉粤—廉客”词汇分级相关系数表

第一级:基本词汇第二级:普通词汇

总词项数139 833

相关系数总和83.754 456.540

平均相关系数0.594 0.548

从表中可以看出,“广粤—梅客”的基本词汇相关度为0.459,普通词汇相关度为0.483,基本词汇的相关度低于普通词汇。而“廉粤—廉客”的基本词汇相关度为0.594,普通词汇相关度为0.548,基本词汇的相关度高于普通词汇。

“广粤—梅客”基本词汇和普通词汇的相关度皆低于“廉粤—廉客”的基本词汇和普通词汇的相关度。

以上结果表明,廉江的粤语和客话由于地缘上较长时间的相邻相接,具备方言直接接触的条件,使得其方言接触度加深,比缺乏地缘相连优势的广州粤语和梅州客话具有更高的词汇相关度。这种特点不仅体现在普通词汇中,也同样体现在基本词汇中。

3)“廉粤客一广粤”与“廉粤客—梅客”相关系数值的比较

廉江粤、客方言共同词汇与广州粤语词汇相关度为0.788;廉江粤、客方言共同词汇与梅州客话词汇总体相关度为0.663。可见廉江粤、客共有词项与粤方言代表广州话更加接近而与客方言代表梅州话较远,也就是说整体更趋粤化而非客化。

表11 “廉粤客—广粤”词汇相关系数表

总词项数 329

相关系数总和 259.333

平均相关系数 0.788

表12 “廉粤客—梅客”词汇相关系数表

总词项数329

相关系数总和218.174

平均相关系数0.663

3.3.2 相关系数分布比较分析

1)“广粤—梅客”和“廉粤—廉客”相关系数分布比较分析k为了说明廉江粤语和客话的关系,将其对比情况与典型的粤语代表广州话和典型的客话代表梅州话的对比情况共同进行分析。通过SPSS11.0统计软件处理,得出0~100%范围内“广粤—梅客”和“廉粤—廉客”的相关系数分布图。

“广粤—梅客”和“廉粤—廉客”的词项相关系数值分布(图4、5)的共同点是:在0~100%的区间内,0、40%~50%和100%上有较多的分布,整体分布曲线呈马鞍形。为0和100%的词项占绝大部分,显出两极分布的趋势。若不计0和100%这两个端点的相关系数,在50%附近的词汇的数量分布较多,在30%以下的低相关系数范围和70%以上的高相关系数范围分布较少,呈较为明显的正态分布,这说明在粤语和客话词汇计量比较中,相关系数值的分布有一定的普遍性和规律性。

“广粤—梅客”和“廉粤—廉客”的词项相关系数值分布的不同是:“广粤一梅客”为100%的词项百分比只有29.499%,而“廉粤—廉客”为100%的词项百分比37.243%,说明在廉江粤、客方言中有更多的相同词汇;与此一致的是,“廉粤—廉客”为0(完全不同的词汇)词汇所占首分比是25.617%,少于“广粤—梅客”为0的词项百分比31.310%,由此说明廉江粤、客方言在长期接触的过程中,相互影响和渗透,它们之间的相同的词汇量增加,相异的词汇量减少,故有较高平均相关系数。

图4 “广粤—梅客”相关系数分布

图5 “廉粤—廉客”相关系数分布

说明:(注:“反映形式”就是某个词项在方言中对应的词条。)横坐标序数表示相关系数范围,例如分段号“1”表示0~10%的相关系数范围,“2”表示10%~20%的相关系数范围,依次类推。(注:“所有关系”不包括双无关系。)纵坐标为分布在某个相关系数区域的词项数占总词项数的百分比。

2)“廉粤客—广粤”与廉粤客—梅客”相关系数分布比较分析(图6、7)

“廉粤客—广粤”和“廉粤客—梅客”的在0、40%~50%和100%处有较高的分布;若不计0和100%这两个端点,不同相关系数值的词项数量分布亦呈较为明显的正态分布,这两个特点与上述“广粤—梅客”及“廉粤—廉客”的分布特点相同。不同的是,“廉粤客—广粤”和“廉粤客—梅客”中为0词项数的分布低于“广粤—梅客”和“廉粤—廉客”中为0的词项数所占比例;“廉粤客—广粤”和“廉粤客—梅客”在为100%的词项数所占百分比皆超过50%,远远高于相同词项数在“广粤—梅客”和“廉粤—廉客”中的分布,这说明廉江粤、客方言共同词汇在广州话和梅州话中都分布较多。再对比“廉粤客—广粤”和“廉粤客—梅客”可知:“廉粤客—广粤”的为0的词项分布量为6.383%,比“廉粤客—梅客”为0词汇分布量(19.149%)少了12.807%;“廉粤客—广粤”的为100%的词项分布量为62.614%,比“廉粤客—梅客”的为100%词项分布量(52.584%)多了10.030%;在低于50%的区间内,“廉粤客—广粤”的词汇量分布较低,而在大于50%的区间“廉粤客—广粤”的词汇量分布较高,这些数据也显示廉江粤、客方言共同语总体上偏近广州粤语,偏离梅州客话。

图6 “廉粤客—广粤”相关系数分布图

图7 “廉粤客—梅客”相关系数分布图

3.3.3 相关系数的词类分布比较分析

为了更细致地揭示方言接触过程中词汇融合与词类分布的关系,有必要进行相关系数在不同词类中分布情况的统计分析。

1)“广粤—梅客”和“廉粤—廉客”各词类中的相关系数分析

分别求出各个词类相关系数的平均值,见图8。

如图8所示,“廉粤—廉客”各词类中相关系数的密集区分布在80%到50%之间,而“广粤—梅客”各词类中相关系数的密集区分布在70%到40%内,可见廉江粤语和客语的词类总体相似度比“广粤—梅客”的要高。

为了找出典型的高相关度词类,我们在“廉粤—廉客”和“广粤—梅客”同一词类中,计算“廉粤—廉客”平均值减去“广粤—梅客”平均值的差,再将差值从大到小进行排序(如下页表13)。

图8 “廉粤—廉客”“和广粤—梅客”词类的相关系数分布图

说明:图中共有27个词类,原来的词汇表中有30类词,对比了《粤西方言调查报告》后有3个词类没有对应的客家方言词项,因此没有代号为21、22、30的词类相关系数。

表13 “广粤—梅客”和“廉粤—廉客”相同词类平均值差

词类编号 10231527136 161 17 18

相关系数差0.24 0.18 0.17

0.15 0.14 0.14 0.13 0.11

0.110.1

词类编号 14261112198 7 209

相关系数差0.09 0.09 0.09 0.09 0.08 0.08 0.07 0.04

0

词类编号 3 244 2 255 2829

相关系数差-0.01

-0.03-0.03 -0.04 -0.05-0.1-0.14 -0.29

从表中的差值可以看出,将词类,平均值差绝对值0.1作为分界点较为合适。差值超出0.1到-0.1范围的词类都可作为典型的相差较大词类。因此,10(衣饰)、23(动作)、15(婚丧)、27(指代)、13(人品)、6(动物)、16(疾病)、1(天文)、17(起居)这九类词中,“廉粤—廉客”的平均相关系数比“广粤—梅客”要高出0.1以上,说明廉江粤语和客话中这些词类比广州话和梅州话更趋接近。

有意思的是:28(副词)和29(连介)两类词中,“广粤—梅客”的平均相关系数比“廉粤—廉客”的平均相关系数要高出0.1以上。本来这两类词属于语言中比较核心的封闭类词,在一般的日常生活接触中不太容易被外方言同化,而且广州话和梅州话又不像廉江粤、客话那样具有近距离的接触关系,为何会出现广州和梅州开放类实词相关度低而封闭类词汇相关度却高的现象呢?我们据此推测,广州粤语与梅州客话也许具有更早期的方言同源关系:这两种方言形成的背景均与宋末北方汉人第三次大规模南迁有关,而且它们都和江西有着密切的联系,早期的同源关系使得它们在更深层的封闭类词汇中显示出一致性;之后长期的分离、生活环境的不同导致了彼此之间差异的增加,并最终成为不同的方言。而廉江粤语和客话之间的接触比粤方言和客方言的形成时间晚,虽然地缘和环境的相似令廉江粤语和客话产生诸多的相同词汇,但大多局限于日常生活中常用的口语词汇,其目的是方便彼此间的生活交流,与语言内部深层结构相关的封闭类词反而并不受表面的接触影响产生同化。当然这种推测只是针对廉江粤语客话的个例分析得出的,是否具有普遍意义,还有待于其他更多方言的统计证明。

2)“廉粤客—广粤”和“廉粤客—梅客”词类的相关系数分析

分别求出各个词类相关系数的平均值,见下图:

图9 “廉粤客—广粤”和“廉粤客—梅客”词类的相关系数分布图

说明:原来的词汇表中有30类词,在进行廉江粤、客共同词汇统计时,只有26类词在廉江粤、客方言中有共同词汇,因此没有代号为21、22、29、30的词类相关系数。

如图所示,“廉粤客—广粤”各词类中相关系数的密集区分布90%到70%之间,“廉粤客—梅客”各词类中相关系数的密集区分布在80%到60%内,说明廉江粤、客语共同词汇总体更接近广州粤语,而并非接近梅州话。其中典型的高相关度词类主要有3(时间)、5(家务)、6(动物)、7(植物)、9(器具)、10(衣饰)、12(身体)、13(人品)等实词类。

虽然廉江粤客共同词汇总体更接近广州粤语,但图9中,在词类4(农事)、词类16(疾病)、词类20(交际)和词类27(指代)上,“廉粤客—梅客”的平均相关系数比“廉粤客—广粤”的平均相关系数高。可见廉江方言词汇基本以接受强势粤方言的影响为主,但同时也存在客方言的影响,这种影响具有双向性,只是程度强弱不同而已。

3.4 统计结果及成因分析

将计量结果从平均相关系数的数值、分布和词类分布三个方面进行比较,其结果都显示廉江粤、客方言之间的词汇相似度比广州话和梅州话之间的要高;廉江粤、客方言共同词汇总体上偏近广州粤语;由此说明廉江粤、客方言受粤语的影响超过其受客家话的影响,也即粤化的趋势大于客化的趋势。其原因是:长期以来,粤语在整个广东地区都处于强势方言地位,粤语使用者有一种潜在的心理优势。我们在调查过程中也发现,廉江客话的使用者一般都会说粤语,而粤语的使用者则很少会说客话,这种情况大概就是粤语心理优势的外在表现。因此在粤方言群体和客方言群体发生接触时,为了能够顺利地进行交流沟通,多数情况下,语用双方中的客话使用者会更多地借用和模仿粤语词汇进行表达。随着这种词汇选择长期、频繁地发生,客话使用者逐步放弃部分客话中原有的词汇,改用粤语词汇或与粤语相近的词汇形式,最终形成了今天廉江粤、客方言接触中词汇特征整体粤化的局面。不过,承认粤方言强势的同时,我们也必须看到客方言对当地粤方言亦存在逆向的影响,只是程度相对较弱。

四 结语

粤语和客家话的接触研究,前人做过不少现象描写和定性分析。但这两种方言在接触过程中究竟谁影响谁,方言接触的深度如何,接触影响与词汇类别有无关系等,至今没有人从定量的统计分析角度来加以验证。本文尝试通过使用更加细化的方言词汇相关度的计量方法,并借助社会统计软件SPSS for Windows 11.0,对廉江市廉城粤语和石角客话中900多个词项进行定量统计分析,藉此更精确地刻画出方言间的接触事实、接触程度和接触方向,为今后的方言比较研究提供有力的证据。由于这一计量方法目前还处于不成熟阶段,文中难免疏漏之处,尚有待进一步推敲。

标签:;  ;  ;  ;  ;  

连江市广东客人词汇相似性的计量分析_廉江论文
下载Doc文档

猜你喜欢