汉语态制中“复合态”的生成,本文主要内容关键词为:汉语论文,态制中论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
汉语和英语相比有很多不同之处,时态的表达方式不同是区别之一。本文在英汉对比的基 础上,对汉语的态制(aspect)作了系统功能性的描述,并着重阐述如何用有限递归的方法生 成其中的“复合态”。
因为英语和汉语表达时态的语法手段不同,所以在用计算机处理这两种语言、试图生成具 有时态意义的表达结构时,会采取不同的办法。Halliday曾给出了英语时态的48种形式,并 描写了这些时态形式的构成(Halliday,1976)。这些复杂的英语时态形式都是由简单的基本 时态形式组合而成的。这是因为在构成一个动词词组的过程中,时态的选择可以有若干次。 不同时态的组合增加形态上的复杂性,同时表现出循环(递归)的规则性。在现有的一些英语 生成系统中,如PENMEN(Matthiessen & Bateman 1991),使用了递归操作来生成复杂时态。 但是,用全循环递归方法来生成汉语态制中的复合态是不现实的,汉语本身的特点将对这种 循环提出限制。下面分成两个部分来阐述这一观点。
1.汉语和英语在时态表达方式上的区别
1.1 汉语的时制主要以词汇手段实现,表达状态意义的语法形式具有多样性
论及“时态”,必涉及“时”和“态”两个方面,即“时制”和“态制”。从时间逻辑上 说,我们在观察一个事件或状态时,应该首先确定时间“参照点”即“观察点”。相对于这 一“参照点”,所观察事件或状态的发生或存在可以分为“过去”,“现在”和“将来”。 时制的作用就是确定“参照点”,使说话时间、事件发生或状态存在的时间和参照时间三者 之间建立起明确的逻辑关系。态制和时制之间是什么关系呢?状态是时间的函数。这就是说 ,在给定事件参照点的前提下,对应于每一个特定的时间点,都存在着一个特定的与该时间 点对应的状态值。两个不同的时间点所对应的状态值的差反映出状态的变化。态制所描述的 即是在特定的时间点或时间段中事件的状态和状态变化情况。“时”和“态”在语法表现形 式上可以不同,这就使得我们能够把二者分开来进行研究。
在英语中,时和态通常都用改变动词形态或添加助动词来表示,二者的表示方法是相互融 合的。同时,形态变化也伴随着词汇手段的使用,这在不规则动词句中表现得较明显。而在 汉语中,时的概念主要通过词汇手段表示,包括使用副词或短语,动词的形态没有任何变化 。据此,人们很容易认为,生成汉语中与态制相关的句法结构应该是比较容易的。事实远非 如此。英语的时态系统有相当规则的形式:零形式,两种限定形式(V+s,V+ed),两种 非限定形式(V+ing,V+en)(Halliday,1976)。但汉语的态制系统却不是由规则整齐的内容构 成的。除了已被公认的表态助词“了”“着”以外,其他哪些动词已经虚化到了可以进入态 制系统的程度,哪些还没有虚化到进入态制系统的程度,远未得到大家的共识。态制应仅由 已经纯语法化了的虚词构成,还是也可以加入副词、助动词等一些词汇意义较强的成分,哪 些形式属于时的范畴,哪些形式属于态的范畴,也还没有一个统一的意见。基于不同的研究 角度,对汉语态制的分析综合可以得出不同的结果。此外,英语时态表达式中词的形态变化 在表达相应的时态意义时是强制的,必须做的。而汉语在表达某种状态意义时,却不是总需 要使用那些有形的表态手段,动词的“零形式”几乎无所不在。也有与此相反的情况,即在 “不该”使用表态助词时,“合法地”使用表态助词,如动词“姓”是静态动词,本不应与 表“实现态”的“了”相结合,而我们却可以说“他早就姓了张了”。也就是说,汉语表达 状态意义的语法手段具有多样性,使得意义与形式之间的对应关系很不明显。
1.2 汉语复合态的组合形式被严格的句法语义条件限制在一定的范围之内
汉语态制中复合态的组合形式是有限的。基于对一个由11种主要的简单态(实现态“了”, 经历态“过”,近经历态“来着”,无标记-持续态“着”,动作持续态“在”,长持续态 “一直”,无标记-进行态“正在”,短语-进行态“正”,起始态“起来”,继续态“下去 ”,将行态“将”)所构成的态制系统(此系统将在本文的第二部分给出,参看2.1图)进行的 统计分析,在所有可能的复合态组合形式中,从句法语义上说都能接受的有31种。其中,由 两种简单态组合而成的(双态复合)是24种,由3种简单态组合而成的(三态复合)是5种,由4 种简单态组合而成的(四态复合)是两种。
(一)双态复合结构:
(1)继续+将行(将要延续下去)
(2)继续+书面-无标记-进行(正在堕落下去)
(3)起始+将行(将要流行起来)
(4)起始+实现(强调结果)(已经打起来了)
(5)起始+实现(强调起始)(跑了起来)
(6)起始+书面-无标记-进行(正在好起来)
(7)无标记-持续+近经历(坐着来着)
(8)无标记-持续+实现(已经+处所PP+挂着了)
(9)无标记-持续+将行(将要+处所PP+挂着)
(10)无标记-持续+短语-进行(正吃着)
(11)无标记-持续+简单-口语-进行(正吃着呢)
(12)动作持续+实现(已经在吃了)
(13)长持续+实现(一直吃了+时量补语)
(14)长持续+近经历(一直在家来着)
(15)长持续+无标记持续(一直挂着)
(16)长持续+动作持续(一直在吃)
(17)长持续+继续(一直延续下去)
(18)长持续+将行(将一直上升)
(19)实现+将行(快要走了)
(20)继续+实现(强调结果)(读下去了)
(21)继续+实现(强调继续)(读了下去)
(22)口语-将行+近经历(要输来着)
(23)实现+经历(曾经)(曾经拿了+数量NP)
(24)无标记-持续+经历(曾经)(曾经+处所PP+挂着)
(二)三态复合结构:
(1)起始+实现+将行(已经快/要打起来了)
(2)无标记-持续+实现+将行(快/要歇着了)
(3)继续+长持续+将行(将一直延续下去)
(4)无标记持续+长持续+近经历(一直坐着来着)
(5)无标记持续+长持续+将行(将一直+(处所PP)+坐着)
(三)四态复合结构:
(1)无标记持续 +长持续+将行+实现(将一直+(处所PP)+坐着了)
(2)继续+长持续+将行+实现(看来这风将一直刮下去了)
以上复合态组合形式中的简单态按生成的先后顺序排列,如“无标记-持续+近经历(坐着 来着)”,首先生成无标记-持续态“坐着”,再将其与近经历态“来着”复合,构成复合态 “坐着来着”。根据上面这一统计结果,我们整理出表一,说明简单态之间进行复合的情况 。
由于汉语的时制主要以词汇手段实现,表达状态意义的语法手段具有多样性,以及汉语复 合态的组合形式被严格的句法语义条件限制在一定的范围之内,我们可以看到,在生成汉语 态制中的复合态时,若要像处理英语那样使用全循环递归的方法是不现实的。因而我们提出 了一种有限受控的循环递归方法,详见下文。这种有限受控递归所表现的是态制系统中简单 态之间的组合关系,与用于生成英语时态所使用的全循环递归有本质的区别。
2.基于系统功能语法的汉语有限递归态制系统
2.1 基于系统功能语法的汉语态制系统描述
根据系统语言学理论,系统被定义为由两个以上的特征所构成的选择点。每个系统伴随有 相应的进入条件。一旦进入条件得以满足,就必须在该系统中选择一个特征。整个态制系统 分为“零形式”和“非零形式”两大类。本文主要谈“非零形式”。从下图可以看到,除了 “了”“着”等表态助词以外,态制系统并没有排除“已经”“曾经”“正在”“一直”“ 将”等时间副词。与此相关联,有两点需要说明。第一,用于生成汉语的态制系统描述不宜 仅仅包含表态助词。从功能的角度出发,仅“了”“着”“过”几个“完全虚化”的表态助 词不能涵盖相应于不同状态意义的多种表达方式。第二,在以往的态制研究中,趋向于仅考 虑“完全态”(perfective)和“非完全态”(imperfective),即仅从“事后”和“事中”的 视角来进行观察,而把“事先”排除在外。我们把“态”定义为“时”的函数,那么,因为 时间是个连续的一维向量,有对应于“事后”与“事中”的“态”,就应该有对应于“事先 ”的“态”。其次,从综合分析可以看到,在生成“复合态”时,“将行态”确实参与了整 个复合循环过程。若将其从态制系统中分出而归入其他子系统的话,将有损系统本身的协调 性而且为实际操作增加一定的难度。尽可能全面地找出对应于不同状态意义的语言表达形式 ,是我们构造这一态制系统的主导思想。对于“标记”概念我们遵循Halliday的定义:“无 标记”被定义为在所有进入系统的条件都不能得到满足时不得不选的选择项(Halliday,197 6)。与无标记相对应,“有标记”即为应满足一定的条件才能够进入的选择项。
下面对系统的基本构成作一说明。“完全态”由“实现”“经历”“近经历”三个简单态 构成。我们把以“了”为一般标记的简单态称为“实现态”而不是“完成态”。“了”并不 总是表示完成,例如“我干了半天也没干完”。对这一现象不少中外学者都有所评述(戴耀 晶,1997;Smith,1991)。“了”实际上所表示的是一种事态的现实性。在我们的定义中“ 实现”被赋予“现实性”意义,而不同于“完成”。“实现态”的“有标记”选择项有两种 意义潜势(meaning potential):“有明确结果”和“无明确结果”。“有明确结果”指已 经使用能够明确说明事态结果的“动补结构”或具有此种功能的词汇手段。赵元任先生在描 述结果补语时专门指出了一类具有状态意义(phase)的补语,如:着zhao,到,见,完,过( Ch ao,1968)。动词与这类补语结合构成的动补结构,包括与具有状态意义的一部分普通结 果补语和趋向补语结合而构成的动补结构(如“打翻”“拿出来”),不一定要加表态助词“ 了”就能够表示实现意义,可以单独使用“已经”。“无明确结果”指未使用具有状态意义 的结果补语的情况,这时,不能单独使用“已经”,而应使用“已经…了”的搭配形式。“ 经历态”的“有标记”选择项有两种意义潜势“动作状态”和“无修饰-性状”。“动作状 态”指使用一般动作和状态动词的情况。这时,可以单独使用“曾经”或“曾”,不一定加 “过”。“无修饰-性状”指使用不加修饰语的形容词的情况。这时,不能单独使用“曾经 ”或“曾”,而应使用“曾经…过”的搭配形式。如:通常不说“曾经胖”,“曾消沉”, 而说“曾经胖过”“曾消沉过”。若形容词前有修饰语,则可以说:“曾经很胖”“曾非常 消沉”。“非完全态”由“持续”“进行”“起始”和“继续”四个简单态构成。“持续态 ”有“无标记-持续”“动作持续”和“长持续”三个选择项。“无标记-持续”通常以状态 动词后面加“着”的形式表示,如“站着”“挂着”。动作动词也可以带“着”,但一般出 现在复合句中表示一种“伴随”的状态,如“吃着饭开会”“看着书听音乐”。“无标记 -持续”包含这两种情况。“动作持续”指“在”加动作动词的情况,如“在唱歌”“在讲 话”。时间副词“一直”是“长持续”状态标记。与一般时间副词相比,“一直”有其特殊 之处。“一直”与表持续状态的助词“着”和“在”之间关系紧密,存在比较固定的搭配形 式;同时,它与其他表态助词“了”“来着”“下去”以及“将”也可以进行复合。所以“ 一直”可以单独表示一种简单态。“进行态”分为“无标记-进行”和“短语-进行”。“持 续态”与“进行态”有区别。“持续态”表示状态在特定时间段的持续。“进行态”表示的 是动态事件在特定“时点”的状态。这里所说的“时点”具有相对的意义,即时轴上给定的 一个时间段,这个时间段非常短以致可以被认为是个“时点”。“进行态”“正在”/“正 ”加动词是这种状态的典型表达形式。
2.2 “复合态”的生成过程及语义关系类型
从上面分析我们可以看到,汉语态制系统中简单态之间的复合是有条件的,而不是任意的 。每个简单态只能与特定种类的其他简单态进行复合,有的简单态则根本不与任何其他简单 态复合。鉴于这种情况,我们在系统中为每一种简单态都作出了复合限定,即如果一个简单 态 要进行“双态复合”的话,我们只给出能够与该简单态进行复合的其他简单态供其选择,而 避免该简单态选择那些不能与其进行复合的其他简单态。如果所生成的“双态复合”形式要 进行“三态复合”,也只能在给定的范围内进行选择。完成复合态的生成之后,系统不再提 供其他选择,生成过程将结束。用这种有限受控的方法,可以保证所生成“复合态”的正确 性。下面以“无标记-持续态(着)”为例说明复合态生成过程。生成简单态以后,系统选择 是否生成复合态。如果不需要生成复合态,生成过程将脱离态制系统;如果需要生成复合态 ,则进入双态复合。“无标记-持续态”可以与其他七种简单态进行双态复合:长持续(一直 坐着),经历(曾经)(曾经+处所短语+挂着),近经历(挂着来着),实现(已经+处所短 语+ 挂着了),将行(将要+处所短语+挂着),短语-进行(正吃着),简单-口语-进行(正吃着呢)。 双态复合完成后,系统可以选择是否需要生成三态复合。若不需要则生成结束,反之则进行 三态复合。“无标记-持续+实现”、“无标记-持续+将行”以及“无标记-持续+长持续”这 三个双态复合形式可以与“将行态”、“实现态”和“近经历态”复合,生成三态复合形式 (要歇着了/一直坐着来着/将一直挂着)。三态复合形式“无标记-持续+长持续+将行”还可 以与“实现态”进行复合生成四态复合形式(将一直+处所PP+挂着了)。四态复合完成后,系 统没有提供更多的选择,生成过程结束。
那么,如何从语义关系上对汉语态制系统中的复合态进行解释呢?我们认为,汉语的复合态 可以分为三种语义关系类型:强调,假设,补充。
“起始+书面-无标记-进行(正在流行起来)”、“继续+书面-无标记-进行(正在堕落下去) ”、“实现+经历(曾经…了+数量名词短语)”、“无标记-持续+简单-口语-进行(正吃 着呢)”、“无标记-持续+短语-进行(正吃着)”、“无标记-持续+长持续(一直坐着)”、“ 动作持续+长持续(一直在吃)”和“继续+长持续(一直延续下去)”八种双态复合形式属于强 调语义关系类型。强调语义关系类型的特点是:1)两种简单态同属于“完全态”、“非完全 态”、“将行态”中的一个子系统。例如“起始+书面-无标记-进行”中的两个简单态同属 于“非完全态”子系统;“实现+经历(曾经)”中的两个简单态同属于“完全态”子系统。2 )在两个简单态中,一个起语义主导作用,一个起强调该语义的作用。在“正在流行起来” 中,“流行起来”起语义主导作用,说明一种新状态从无到有开始出现。“正在”则强调这 一状态的变化。在“正在堕落下去”中,“堕落下去”是语义内核,说明一种状态变化已经 存在并将继续存在。“正在”强调这一状态变化的延续。在此,语义内核“V起来(下去)” 必须具有持续渐变的语义特征,否则不能与“正在”进行复合,如可以说“正在好起来”而 不说“正在笑起来”。因为“笑起来”这一状态变化过程是瞬间完成的,而“正在”所强调 的应是状态持续变化过程中的某一时点的状态,所以二者不能进行复合。除了要求“V下去 ”具有持续渐变的语义特征以外,复合态“正在V下去”要求“进行”“维持”“发展”和 “支撑”类动词,而一般来说,排斥具体行为动词。复合态“实现+经历(曾经)”中“V了” 是语义内核,“曾经”强调状态的现实意义,同时赋予其经历意义。值得注意的是,“V了 ”后面必须跟数量名词短语,才能和“曾经”进行复合。也就是说,在“曾经V了”中,“ 曾经”所强调的必须是一个有始有终的有界事件。“曾经捞了鱼”听起来意义似不完整,而 “曾经捞了两条鱼”就很自然。在“无标记-持续+长持续”、“动作持续+长持续”和“继 续+长持续”三种复合形式中,“无标记-持续”、“动作持续”和“继续”三种简单态分别 表示语义内核,“长持续态(一直)”的作用在于强调这种状态的持续性。3)强调语义关系类 型中两个简单态进行复合的生成顺序是不可逆的。首先生成具有语义内核作用的简单态,再 将它与起强调作用的另一个简单态进行复合生成复合态。若将顺序颠倒,则有可能使相应的 复合条件得不到满足。例如“正坐着呢”(无标记-持续+简单-口语-进行),首先需要生成的 是语义内核“坐着”,而不是“正坐呢”,因为后者在此不能正确表达状态的持续意义。
绝大部分复合态形式属于补充语义关系类型。这类复合态的特征是:1)“完全态”与“非 完全态”复合或“将行态”与“非完全态”复合。2)在“完全态”与“非完全态”的复合形 式中,“完全态”起对“非完全态”所表示的持续状态的现实性或经历性作补充说明的作用 。在“将行态”与“非完全态”的复合形式中,“将行态”起对“非完全态”所表示的持续 状态的即将出现作补充说明的作用。3)补充语义关系类型中两个简单态进行复合的生成顺序 是不可逆的。首先生成的应是表示持续状态的“非完全态”简单态,然后与“完全态”或“ 将行态”进行复合。这是因为,“非完全态”需要对动词有持续性的限制,而在生成复合态 之前,这一限制条件要先得到满足,否则,有可能生成“将死下去”“将醒起来”这样的错 误形式。又例如在“长持续+实现”(一直吃了+时量补语)这一双态复合形式中,首先生 成的应该是“一直吃”,以表示事件在较长时段上延续;“了”+时量补语(长时段)是对这 种长持续状态的补充说明。
“实现+将行”和“将行+近经历”两种双态复合形式属于假设语义关系类型。这类复合态 的特征是:1)“完全态”和“将行态”之间进行复合。2)因为“完全态”主要表示事态的现 实性或经历意义,“将行态”表示事态之将有,在逻辑上似存在着冲突。我们认为,二者结 合表示一种基于真实条件的假设意义。如在“天要黑了”和“要输来着”中,“要黑”而还 没黑,“要输”而没有输,所指即是一种假设的情况,具有一种虚拟的现实性或经历意义。 3)假设语义关系类型中两个简单态进行复合的顺序是可逆的。这是因为,“完全态” 与“将行态”在对动词类别的要求上基本没有冲突,首先生成哪一部分对整个复合形式的语 义没有影响。
在五种三态复合形式中,“起始+实现+将行”(要打起来了)和“无标记-持续+实现+将行 ”(要歇着了)属于补充假设语义关系类型。其中“实现态”与“将行态”之间是假设语义关 系类型,二者与“起始态”和“无标记-持续态”之间分别是补充语义关系类型。最先生成 的应是“起始态”(或“无标记-持续态”),然后,生成“起始+实现”或是“起始+将 行”(“无标记-持续+实现”或是“无标记-持续+将行”),最后与另一个简单态复合。另外 三种复合形式“继续+长持续+将行”(将一直延续下去)“无标记-持续+长持续+近经历”(一 直坐着来着)“无标记-持续+长持续+将行”(将一直+处所PP+挂着)属于强调补充语义关系类 型。其中,“长持续”与“无标记-持续”和“继续”之间是强调语义关系类型;其复合结 构与“将行”和“近经历”之间是补充语义关系类型。整个复合形式的生成顺序不可逆。
两种四态复合形式“无标记-持续+长持续+将行+实现”(将一直+处所PP+挂着了)“继 续+长持续+将行+实现”(看来这风将一直刮下去了)属于强调假设补充语义关系类型。“无 标记-持续”和“继续”与“长持续”之间是强调语义关系类型;“将行”与“实现”之间 是假设语义关系类型;两组双态复合形式之间是补充语义关系类型。表二是对汉语态制中复 合态语义关系类型的综合说明。
需要指出的是,尽管存在着这些“复合态”形式,汉语态制的表达形式实际上是以简单态 为主。根据我们的统计,在415000字的叙述性语言材料中,复合态形式只出现了134次,其 中 “起始+实现”出现频率最高,为71%,“实现+将行”(将行+实现)次之,为11%,余下 为其他形式。
通过以上的综合分析,我们可以得出如下结论:汉语的时制主要以词汇手段实现,表达状 态意义的语法手段具有多样性,意义与形式之间的对应关系不明显;汉语复合态的组合形式 被严格的句法语义条件限制在一定的范围之内。在生成汉语态制中的复合态时,不宜使用全 循环递归的方法,而应使生成过程在有限受控的条件下进行。基于尽可能全面地找出对应于 不同状态意义的语言表达形式这一主导思想,我们给出了汉语态制的系统描述,解释了根据 该系统描述生成汉语复合态的过程,阐述了复合态的三种语义关系类型,即“强调,假设, 补充”,并说明了生成汉语复合态的有向性。
要想根据系统功能描述来生成汉语句子只有系统网络本身是不够的。系统的各个子系统还 都 需要明确的进入条件。这就涉及对不同种类动词的性质及其与系统的关系进行深入的分析和 归类。这部分工作目前正在进行当中。除本文谈及的一些相关内容外,许多具体规则还要 在系统实现过程中形式化后进行验证修改,其结果将在以后的文章中作专门介绍。
致谢:本文所介绍的内容是为了在一个基于系统功能语法的多语种语言生成系统中实现汉 语 生成而进行的理论准备工作的一部分。文章主要介绍所采取的理论方法及分析结果。生成的 结果数据将在系统实现后适时发表。作者感谢德国Bremen大学John Bateman教授对这一研究 的鼓励与支持。在本课题研究过程中,李临定、徐枢、杨成凯、董振东、沈家煊几位先生给 予了热情指教。徐枢和李临定先生通读了本文的初稿,提出了修改意见。在1999年7月于新 加坡举行的第26届系统功能语言学国际会议上作者有幸向Michael Halliday先生当面请 教,对原稿中的部分观点进行了补充说明,对态制系统网络作了一些技术性修正。在此向诸 位先 生诚表谢意。