汉语方言中的话题连续性测量
宋佳丽
内容摘要: 在介绍Givón 提出的三种测量话题连续性的方法基础之上,检测其是否同样适用于汉语及汉语方言。同时,基于测量的数据,尝试回答不同语言(或方言)的话题连续性优先序列差异成因。
关键词: 方言 话题 连续性
本文共分为三个部分,第一部分是对话题连续性及相关理论、概念的简介,主要焦点放在话题连续性的测量方法上;第二部分以汉语口语为例,进行话题连续性测量,并尝试对汉语方言进行话题连续性测量的可行度考察;第三部分是对汉语方言话题连续性测量结果的分析与总结。
一.话题连续性及测量方式
(一)相关概念介绍
关于“话题”这一概念,中外学者多有论述,本文则主要采用Givón(1983)的观点,即:语法上的“主语”,对应会话功能上的“话题”。
在讨论话题连续性问题伊始,有必要对话题连续性在会话中的地位做个了解。Givón认为,基于“段落串”的微观传统,词语只有在组成小句后才能携带信息,而众多小句又组成“主题段落”——这与会话直接相关,可透过其开始讨论会话的连续性。会话连续性中又分为主题连续性、动作连续性和话题连续性三个部分,其中主题连续性是基础,三者的蕴含序列可以表示为:主题>动作>话题。本文的讨论焦点是话题连续性,它与主题段落密切相连:一个话题是最易成为连续性标记的,同时,参与者和主题的联系最为紧密,参与者最可能被编码为首要话题或者说语法上的主语。
本站点VOCs在线检测仪可检测56个VOCs物种,包括29种烷烃化合物、10种烯烃化合物、16种芳香烃化合物和乙炔。图8为春节期间站点的VOCs小时浓度变化情况及平均物种组成情况。期间TVOC浓度范围在9.3~61.8ppbv,平均浓度为22.0ppbv。在所有VOCs中,烷烃占比最高为64%,其次为芳香烃(15%)、烯烃(14%)和乙炔(7%)。具体来看,排名前十位的VOCs物种分别为乙烷、丙烷、乙烯、正丁烷、异戊烷、乙炔、甲苯、苯、正戊烷以及丙烯。
在主题段落中,假设主题段落里的小句表述的是同一个话题时,那么可以根据其在段落中的位置将话题分成三个类型:
1.链首话题:新的话题,一般是一个非连续的话题。
2.链中话题:连续性话题,但非最大持久性。
再看回指距离,以语料中出现频率最高的话题“芭乐”(11次)为例子,其中直接用名词“芭乐”回指的有6次,用DEF-N回指的有4次,使用零形回指的仅有1次。而在这11次回指“芭乐”的过程中,回指距离少于1个小句,即下文立即提及的情况有5次,隔了超过两个小句再次提及的有3次,也就是说“芭乐”这一话题的连续性非常之高,且使用单一名词回指手段的频率也是最高。与之相比,出现频率很低的话题“帽子”(2次),回指距离是1 个小句,两次提及分别用的是“那个帽子”和“帽子”,而非代词或零形式。
3.链尾话题:连续性话题,又是非持久性话题。
Givón对于测量话题连续性的方式,主要是从可及性、可识别性来考察的,且测量是基于文本而非对话者。因为文本提供两类关联的信息:其一,言者采用纯语言或语法化的手段去编码话题;其二,话题的位置,取决于主题段落的结构、上一次提到的距离、其他话题的聚集、下一次提及的距离等。具体的话题连续性测量方式有以下三种:
回数法:该方法是测量同一个话题在当前和上一次出现之间的空位,空位的测量单位指左边的小句数量。因此1个小句时是最小价值,即最大连续性。Givón将空位的上限定在20个小句,当话题不出现在这个范围内,那么20的价值就是无意识的并且是非连续的。这意味着,不定指的指称话题是通过定指化实现最大价值。当然,语域中的表现手法不一定要显性的,很多也可能通过零形回指提供话题。
其三,话题重复和犹豫停顿作为最不连续性的两个话题标记手段,在英语口语中得到了很好的验证。其底层序列如下:
衰减法;前面两种测量方法,考虑到的是前文,且都与听者相关。第三种方式则与后文有关,是从言者角度出发。其假设如下:越重要的话题会越频繁地出现在语域中。此处,测量的就是右边的小句数量。最小的价值在0,即后文立马提及,同时这一方法不存在最大价值。
(二)测量实例:以英语口语为例
Givón在提出测量话题连续性的相关理论后,分别对多种语言进行测量,本文着重回顾英语口语的实例检验。为了更好地了解测试过程的各项指标,以及对测试结果的分析,需要事先说明如下几种话题标记结构:
谷氨酰胺酶活力检测方法:定义为40 ℃下,每1 min催化1 μmol谷氨酰胺转化为谷氨酸所需要的酶活力,单位定义为1 U。
1.零形回指:下分并列零形和附属零形。
2.代词:仅考虑第三人称(单、复数都包括)。
3.定指NP’s[DEF]:包括专名、带定冠词的名词和受修饰的名词。
首选方案:TDF/FTC(或TDF+3TC或ABC/3TC或 ABC+3TC)+LPV/r(或 RAL)。
零形回指>非重读代词>重读代词>完全DEF-NP>受修饰的DEF-N
设由主观赋权法唯一参照物比较判断法确定的指标权重系数为pj,客观赋权法熵值法确定的指标权重系数是qj,将两个权重利用公式7生成一个权重,即最终权重系数为:
5.定指NP’s 后加停顿[DEF-PAUSE]:因为有了停顿,所以经常将其标记为高度非连续性话题。
6.重复的定指NP’s[DEF-REP]:话题重复也是高度非连续性话题一个标记。
7.左移位LD。
8.右移位RD。
9.指示代词[DEM]:常用“that”表示,一般用于指称刚刚提及的大的语意单位,而非小句层面的话题-参与者。
通过上述的理论方法,对英语口语语料进行数据分析后,Givón得出如下结论:零形回指是最限定的指称手段,其次是代词和定指NP。英语中定指NP、左右移位的指称距离和其他语言遵循同样的等级,即最高的指称距离要么是犹豫停顿、重复停顿,要么是定指NP的移位。定指NP比单纯的定指持久性要高。定指左移位的高持久性和高指称距离,使其出现在链首用于引进新话题。
“交过了?”殷明有些诧异,又有些慌乱。自从三个月那个事故发生之后,他面对的都是指责、谩骂和躲避,甚至连自己的女友也离自己而去了,同宿舍的人也避如蛇蝎地搬走了,留下他一个人住在空空的宿舍里,没有人来看过他。很久没有见到这样温暖的笑容了,殷明觉得自己竟然有些不适应了。
随着城市轨道交通运营的发展,弹性短轨枕道床轨道受到运行列车的不断冲击,逐步出现橡胶套靴老化和变形、轨枕吊空、轨距变化大及减振效果降低等问题。本文以武汉地铁1号线改造项目为工程背景,通过改造方案分析和优化研究,认为采取换铺轨枕和更换新扣件的改造方法,在保证减振效果的基础上,有效地解决了上述病害。实践证明,弹性短轨枕轨道经改造后,轨道系统稳定性增强,大大降低了维护工作量,行车安全亦得到了有力保障。此外,通过分析论证,认为保持无缝线路状态对轨道进行改造施工具有可实施性,且相较于原方案分解为有缝线路施工,具有成本低、风险小等明显优势,可为后续轨道改造提供参考。
简而言之,对英语口语话题连续性的测量结果可概括为三点:
重症心力衰竭患者会出现心室排血不足或者受阻的情况,其心脏舒张压升高,增加肺部毛细血管压力,增加血管管壁通透性,血液外渗,产生急性肺水肿症状,患者气体弥散障碍,呼吸血流比例失调,进一步引发患者呼吸衰竭,出现低氧血症及高碳酸血症,增加患者心脏负荷。使用有创机械通气可纠正患者酸中毒,改善低氧血症,提升血液代谢及输氧能力。
其一,话题连续性和其标记手段是紧密相连的。可以将二者的关系表述成下列层级序列:
4.所有格定指NP[DEF-P]:大多数用所有格代词“My”进行标记。
赣语:DEF-N(18)>人称代词=零形回指(9)>单一名词(8)
其二,动词前的话题标记着低连续性,动词后的则标记高连续性,等级如下:
述题-话题>话题-述题
在严格的词序语言中(如:英语),RD 使话题具有高连续性,同时发现RD比中性词序更加连续,LD比其更不连续。等级如下:
RD>中性词序>LD
歧义法;当前语域中的其他指称可能会对话题的可及性、可识别性产生颠覆性影响。为了最小化指称间距的明显联系,把“当前语域”限定在左边的1-5个小句内,最常见的情况是3个小句。这样的设定是有一定的基础的:如果一个话题已经占有主要的位置,并且在其后的3 个小句的表达内能清楚的辨别,那么其他潜在干扰性的话题便不会对话题的识别产生干扰。承前,若是在相关距离内没有发现干扰性的指称,那么歧义值就是1。若是不止一个干扰性的指称,那么歧义值就是2。在其他一些研究中,歧义值一般也不超过3。
述题>述题-话题>话题-述题>话题
为了尝试回答上述问题,笔者分别对闽语、粤语、吴语、湘语、赣语、客家话的同主题语料进行统计,本文只取网站上提供的第一则语料。首先,采用回数法进行统计时,用于回指的话题标记手段,在不同的方言中呈现出了不同的优先序列。具体如下:
二.汉语方言的话题连续性测量
按照Givón测量英语口语话题连续性的思路,笔者不禁思考,汉语的话题连续性可以进行测量吗?上述三种测量方法是否同样适用于汉语包括汉语方言?不同汉语方言测量所得结果有何差异?带着这些问题,笔者检索过往研究,发现采用过该种方法测量少数民族语的有《下坎侗语口头叙事语篇的话题连续性研究》;用于测量汉语的研究有诸如《〈左传〉话题的连续性研究》,该文语料属古代汉语,与现代汉语口语差异较大。总体而言,对汉语特别是汉语方言进行话题连续性测量的研究尚不多见。
基于该背景,为了检测Givón的方法是否同样适用于汉语及汉语方言的话题标记结构,笔者统一选取台湾采集转写的Chafe《梨子的故事》的口语语料[1],分别对不同的汉语方言的话题连续性进行测量。
清皮锡瑞认为宋初经学“笃守古义,无取新奇,各承师传,不凭胸臆”[注][清]皮锡瑞:《经学历史》,北京:中华书局,2004年,第156页。 。实际情况并非完全如皮氏所言,宋初学者在阐述道统论时,融贯了唐宋古文革新运动中“文”与“道”的关联性阐述,有以孟子心性说对抗佛教心性说之意,推动了宋初儒学的转型发展。
(一)北方话
首先,为了直观考察Givón的测量方式是否适应于汉语,笔者选取了现代北方方言的语料作为代表进行分析。在实际操作中关于话题所属单位如何进行选择,该问题对于英语等印欧语言是非常容易解决的,因为小句是非常重要的一个测量单位。然而,在缺乏形态变化的汉语中,如何准确合理地切分小句虽然还尚有争议。目前主要的三种代表性观点:(1)陈平、宋柔的“标点符号说”;(2)徐赳赳的“兼顾停顿和功能的一个主谓结构说”;(3)殷国光的“自成一读的、述谓中心说”,根据三种方法进行语料处理,基本都能划分出篇章回指研究中的大多数小句。故此,再结合刑福义的“小句中心说”,我们认为在汉语中以“小句”为单位同样能进行语篇话题研究。
北方话“梨子的故事”语料中,统计所有用于回指的话题标记手段,我们可以发现一个非常有意思的现象,即在本文使用的口语语篇共30 个小句中,定指NP’s(13次)和人称代词(13次)两种手段的使用频率最高,零形回指(11次)和单一名词(11次)的使用频率稍低。与Givón在英语中所测量出的连续性优先序列结论不同,即:零形回指>非重读代词>重读代词>完全DEF-NP>受修饰的DEF-N(下文简称该种类型为“英语型”)。因本文选取语料有限且篇幅较短,暂无法很好区别四种类型的具体优先次序,结合前人研究来看,汉语口语中表话题连续性的序列为DEF-N>人称代词>单一名词>零形回指相对恰当(下文简称该种类型为“北方话型”)。在我们的统计结果中,最为突出的一点便是零形回指的位置,在英语里,这是最具连续性的一类标记,但汉语中该手段承担的功能却让位于单一名词。
目前该船共配员27人,采用整体外包模式,日常停靠海口航保工作船码头,主要负责琼州海峡中水道、定线制、湛江、北海以及西南沙水域等浮标维护保养工作,全年作业天数约100天,浮标作业任务量相对较小。
从上述的测试中可以看出,理论上,Givón归纳的话题连续性测量方法同样适用于汉语,但在不同的语言中测量出的结果不一定相同,有时甚至会截然相反。汉语作为一种复杂的语言,其内部又有众多区别显著的方言,那么在不同汉语方言中的话题连续性测量是否与汉语标准语相一致?话题标记在不同的方言中会呈现出怎样的差异呢?
(二)其他汉语方言
这一序列是根据“重要信息优先”原则排列的,左边的是最重要的,右边则不那么重要。
闽语:零形回指(30)>人称代词(19)>DEF-N(14)>单一名词(3)
粤语:零形回指(33)>单一名词>(31)人称代词(28)>DEF-N(19)
客家话:DEF-N(11)>人称代词=单一名词(10)>零形回指(9)
湘语:DEF-N(25)>零形回指(18)>人称代词(17)>单一名词(11)
A routine computed tomography (CT) scan detected a right-sided enhancing mid-pole renal mass measuring 2.3.
吴语:DEF-N(36)>人称代词(30)>零形回指(18)>单一名词(14)
根据潮流分析,线路在不安装串补装置的情况下,最大运行负荷时线路的沿线电压分布情况如图7所示。从图中可以看出该线路较长,且负荷较重,导致电压随线路增大而降低,线路末端更是从变电站10 kV母线侧的10.5 kV降到了8.7 kV。同时,线路在9 km左右之前,电压下降比后端线路要快,这是因为线路前端主要位于城市郊区,商业用电和工厂用电较多,而后端用户多位于城乡结合处的农村,多为居民用电,导致前端电压下降较快。
左边的连续性最高,从左往右呈递减趋势。
从整体上直观来看,汉语方言在表现话题连续性上主要呈现出两种类型,即闽语、粤语较为接近英语型,其他方言较为接近北方话型。零形回指是一个显著的类型划分标记,具体到以主要话题“梨子”[2],我们比较来看,北方话型中以吴语为例,其中回指出现频率最高的话题“生梨”(11次)时,用DEF-N回指的有9次,直接用名词“生梨”回指的有4次,使用零形回指的有7次。英语型则以闽语为例,其中回指“梨子”(12次)时,直接采用名词回指和DEF-N回指各有1次,而使用零形回指的频率高达10次。
下面,我们再用衰减法进行回指距离上的测量并对数据加以统计。当统计不同方言这最高频话题≤1 个小句,以及最高频话题>1个小句的次数时,呈现出的局面为,北方话5:3,闽语6:6,粤语19:5,客家话6:3,湘语6:5,吴语14:6,赣语9:0.在汉语方言中回指“梨子”的过程中,回指距离少于1个小句,即下文立即提及的情况频率高于隔了超过两个小句再次提及。除了闽语的两种概率一样,这很有可能是由于语料较少造成的情况。换言之,“梨子”这一主要话题的连续性非常之高,且在各方言中都呈现出高度的一致性。
三.小结
通过上文对汉语各主要方言的话题连续性测量尝试,笔者认为Givón的方法对汉语方言的话题连续性测量同样具有可行性。同时,我们也看到不同的语言或方言呈现出不同的话题连续性优先序列。下面尝试就测量的结果作一些说明和解释。
其一,闽方言、粤方言语料中零形回指的使用频率非常之高,在各方言中较为突出。以闽语语料为例说明,一方面是句子主语经常省略,尤其是当陈述一个连续画面或片段时,例如[3]
此处的省略的主语是“一个囝仔”,只出现在这一对象出场时;宾语偶有省略。另一方面是主要叙述对象的表达方式常常是用“一/迄篮”来代指“一/迄(那)篮梨仔”,即“一/迄+量词”结构用于回指在闽语中相当常见。在这一点上,我们赞同刘丹青(2017)的看法,由于汉语词类库藏中的量词是显赫范畴,指示代词的功能常由“指示词+量词”组合完成。汉语方言指示词的主要类型以指示代词兼指示形容词为一端,以基本指示词只能修饰量词另一端,体现了量词显赫型语言的特点。
其二,汉语包括汉语方言中单一名词能在话题连续性序列占有一席之地,主要原因在于对比印欧语系中名词或与冠词、指示代词等连用,或采用复数形式,无法单独使用,形式上有要求。汉语则不然,名词使用在形态上并无太多束缚。另外,在汉语方言中话题连续性序列兼具两种类型,其一是英语型,即一般认同的语篇回指规律,形式越轻,回指频度也相对较高;另一种就是北方话型,名词性话题成分的回指频度远高于代词性回指成分,DEF-N 回指手段居于序列顶端,这也印证了乐耀(2007)总结的汉语语篇中回指规律,即在名词或名词短语话题成分回指中,形式越轻,回指的频度越高;代词话题成分回指中,反而是形式越重,回指的频度越高。
其三,再回指距离方面,不同语言或方言呈现出共通性,即话题连续性高的对象总能迅速被回指,在本文统计的语料中,赣语语料在这点上表现得最为突出。同时,我们也观察到部分方言语料中,回指距离小于等于一句和大于一句的次数相当,这种差异性很可能出在叙述者身上,不同的叙述习惯导致主题的不连贯。譬如闽语,叙述者将叙述重点放在了人物“小男孩”身上而非“梨子”,所以“梨子”的回指距离测量结果与预计有差异,但“小男孩”的回指距离测量结果就符合结论。
步骤3:在连续虚拟阵列流型的基础上,根据式(17)~(21)进行空域平滑,得到虚拟阵列的接收信号协方差矩阵;
其四,人称代词处于话题连续性序列的前端,无论是英语型还是北方话型都是如此,对于回指人物的策略各方言的一致性较高,也可从侧面看出不同方言丰富的人称代词,例如:粤方言的“佢”,客家话的“佢等”、“佢爸”,吴语的“伊”,赣语的“渠”等。
上述是笔者对汉语方言话题连续性问题的一个小结,本文仅是一次结合方言语料和话题研究的简单尝试,由于测量、统计的语料数据并不算多,对测量结果的解释也有待加强,希冀在未来能有更加深入的研究和突破。
注 释
式(2)即目标函数,表示给定i,j,求得3项成本价值量最小的路径r.其中,Yijr为路径r的成本价值量.由节点间运输成本和枢纽点中转成本构成:
[1]《梨子的故事》语料来源:http://www.pearstories.org/mandarin/mandarinc.htm
[2]不同方言对影片中“梨子”这一物体的具体指称不同,诸如“梨”、“生梨”、“芭乐”等,但代表的都是同一对象。
[3]语料格式直接采用源语料的形式,不做修改,零形回指为笔者后续添补。
参考文献
[1]李宗江.近代汉语的话题标记及其演变[J].汉语学报,2017(4).
[2]梁英.下坎侗语口头叙事语篇的话题连续性研究[D].广西师范大学硕士论文,2016(6).
[3]刘丹青.汉语指代词的若干库藏类型学特征[J].语言研究集刊,2017(1).
[4]刘文霞.汉语零形回指研究综述[J].青海师范大学学报(哲学社会科学版),2009(6).
[5]刘雨荷.《左传》话题的连续性研究[J].祖国,2016.
[6]强星娜.话题标记与句类限制[J].语言科学,2011(3).
[7]乐耀.现代汉语语篇话题探微——一项基于不同语体语料的研究[D].华中师范大学,2007(5).
[8]郑友奇.词汇功能语法视角下的汉语话题和话题结构研究[D].上海外国语大学博士论文,2017(6).
[9]T.Givón.TopicContinuityinDiscourse:A quantitative cross-language study [M].Typological Studies in Language,Vol.3.Amsterdam:John Benjamins.1983.
(作者介绍: 宋佳丽,厦门大学中文系2017级硕士研究生)