汉语量词系统的建立与复数标记“们”的发展,本文主要内容关键词为:量词论文,汉语论文,复数论文,标记论文,系统论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
1.引言
每一种语言都有数的观念。最常见的一种是单数和复数的区别,它们常以形态加以区分。 比如英语的名词book 表复数时加词尾- s:twobooks(两本书)。汉语没有相应的复数标记,不管是多少书, 都是同一形式“书”。不同于英语的另外一点是,现代汉语里数词不能直接修饰名词,必须用量词来连接,比如“两本书”。也就是说,现代汉语的名词数量观念不是用单复数表示,而是用量词表示。
单复数标记和量词标记之间存在着密切的关系。有一些语言学家根据采用哪种标记系统来确定一种语言的类型。比如,Chierchia (1996,1997)详细讨论了复数标记和量词系统之间的相互制约关系,得出结论:使用量词系统的语言一般不会有复数标记。从语言类型学的角度考察的结果显示,一种语言不同时兼有复数标记和量词系统。表面上看来,汉语是属于使用量词系统的语言,没有复数标记。但是,事实并非如此。汉语是既有量词系统,又有一个复数标记“们”。“们”主要是用于代词之后表示复数的,但是也可以用于普通名词之后,比如“老师们”。 这种在普通名词之后的用法, 有不少学者认为是集合量的标记(collective marker,参阅Chao 1968:Norman 1988;Iljic 1994 , 1998)。李艳惠(Li 1998)提出了不同的看法, 证明集合量标记的说法无法解释“们”的许多句法特点,而且也不能说明采用量词系统的汉语与采用复数标记的语言例如英语之间的本质区别。她从形式上提出另外一种分析方法,“们”不仅仅是一个表示集合量的标记,它还是一个在名词短语里的“定词”位置上实现的复数标记,典型的名词短语结构为:[定+[数+[量+[名]]]](注:这些术语的对应英语说法分别为:“定”-determiner,“数”-number,“量” -classifier,“名”-noun。)复数标记是在“数”的节点下衍生的(generated),根据中心语位移限制原则(Head Movement Constraint,Travis 1984),因为介于数词和名词之间的量词会限制名词直接与数词结合,复数标记只能在“定词”位置上与名词结合。这与没有量词系统的语言的情况不同,比如英语,它们的典型结构为:[定+[数+[名词]]]。在这种结构中,数词与名词紧邻,两者因而可以结合而不违反中心语位移限制原则。这种借助名词短语结构的不同来解释不同语法的复数标记的差异的分析法,可以解释以下一些语法现象以及“们”的句法行为:
a.英语没有量词系统,它的普通名词可以有复数形态标记。
b.汉语具有量词系统,它的复数标记只能与位于“定词”位置上的名词结合。
c.“定词”位置上的成分主要包括代词和专有名词。普通名词可以从自身原来的位置移到“定词”位置,而变成有定名词。这种位移必须遵循中心语位移限制原则,该原则排除了具有数量成分的名词短语内的名词位移的可能性。
上述分析又可以用来解释以下事实:
a.“们”可以跟在代词、人名和一些普通名词之后,比如“他们”、“小强们”、“孩子们”。
b.代词或人名加“们”的短语之后可以再跟上一个数量短语,但其前则不允许加任何数量成分。例如:
(1)我对他们三个(孩子)很好。
*我对三个他们很好。
c.可是当一个名词带上“们”后,其前和其后都不允许数量短语出现。
(2)*我对孩子们三个很好。
*我对三个孩子们很好。
d.普通名词加“们”一定是表示“有定”的。
(3)我想去看孩子们。
总而言之,汉语作为一种具有量词系统的语言,是有复数标记的,只不过它的复数标记受到其特有的名词短语结构的影响,因而带上一些不同于已经为人们所认识的复数使用现象。这种分析对量词系统和复数标记的关系作出形式上的解释:一种语言如果不使用量词,就有可能存在复数标记(注:Saggart (1993)和Peyraube (1998 )提到上古汉语没有量词,有趣的是这时的汉语可能有个复数标记:-r-中缀。 如果真有这个复数中缀存在的话,它可以说明复数标记和量词系统之间的制约关系。)。如果一种语言的名词计数一定要用量词,其复数标记就不会出现在名词位置,只能出现在定词位置。名词复数标记与量词之间的相互制约关系也反映在汉语的发展史上,这正是本文讨论的重点。
汉语最早的量词例子始见于一世纪左右的文献中(参见王力1958),在此之前汉语的数量表达是没有量词的,在此之后的很长一段时间量词也不是必须的。现代汉语中的数词和名词之间必须有量词的语法现象形成于十五世纪左右。复数“们”的引进是十至十一世纪之间的事(注:编者按:笔者在这里所说的汉语实际上是文献中的汉语,不包括当时现实生活中的活的话语。在当时,书面语记录的不是口语,两者之间的距离是相当大的。)。这里边有几个问题值得我们思考:
第一,在“们”出现的时候,根据李、石(1998a)的统计, 汉语半数以上的数量表达式是没有量词的。从理论上讲,“们”应该出现在这些没有量词的“数+名”短语之后,即承认量词和复数之间的不相容性。可是历史上出现的不是这种情形。其原因是什么呢?
第二,上古汉语是典型的非量词语言,按照类型学的理论,这个时期最有利于一个复数标记的产生。那么“们”为什么直到十世纪才出现呢?
第三,“们”从产生到量词系统的最后建立,大约有五百年的时间。这期间为量词的发展提供了比较大的空间,“们”又有什么样的发展呢?在量词系统最终建立之后,“们”的发展又受到什么样的限制呢?
2.“们”的语法化过程
2.1 对复数“们”起源的各种假说及其存在的问题
王力(1958:355—7)认为,复数标记“们”的产生是过去一千年来汉语代词系统的最重要的发展,可是到现在为止,人们仍然说不清楚它的来源。学者们对此进行了各种各样的猜测,主要有以下三种有代表性的说法。
吕叔湘(1949a)推测, “们”可能是来自中古汉语表类属的“等”。从功能上看,两者确实存在着相似之处。问题是跟“等”同时使用而且功能相近的还有“曹”、“辈”、“属”等,为什么只有单单一个“等”发展成了复数标记呢?更重要的是,“等”的类属用法一直沿用到现代汉语,表示列举不尽,比如“老王等”,它的用法仍明显与复数“们”的用法不同。还有,“等”和“们”的语音形式也相差甚远,很难解释前者怎么演化成后者的。总之,我们认为“们”和“等”之间只存在功能上的相似性,没有同源关系。
Norman(1988:120 )提出“们”实际上是来自“每”和“人”的合音,即取“每”的声母和“人”的韵母。合音词的确是汉语史上常见的一种现象,表面看起来这种说法似乎有道理,但是细究起来就会发现问题。首先,一个合音词产生的先决条件是,导致合音的两个词的共现频率应该比较高,可是在十世纪之前,“每”和“人”的共现相当罕见,我们调查了《世说新语》、《敦煌变文》和《祖堂集》,只有在《敦煌变文》中发现两例,其余两书中一例未见。更重要的是,无论是在分布上还是在意义上都很难说明,“们”是来自“每”和“人”的合音。我们找到的例子中,“每人”都是单独用作主语,然而复数“们”则必须附着于一个名词之后;“每人”是表示所有的人,然而“们”只是表示一个大于一的量,它们的意义也不一致。所以我们认为“们”是不大可能来自“每”和“人”的合音的。
江蓝生(1995)提出了另外一种解释,“们”是源于中古汉语表示类属的“物”。作者描写了“物”的语音形式是如何演化成“们”的,过程相当复杂。语音上的论证总是具有很大的或然性,古音的语音构拟本身就有很多不确定的因素。这种说法的另外一个主要问题是,“物”主要表示无生命的类属,“们”则只能表示有生命的人的复数,很难理解何以有这样大的跨越。另外,如果“们”是来自中古汉语的“物”的话,那么那时的“物”应该具有与“们”相似的分布,即也应该常用于代词和表人的名词之后,可是“物”并没有这种用法。由此可见,江的解释也难令人信服。
我们对“们”的起源有一个非常简单的解释,它是来自于原来表示“家庭”、“一组”、“学派”的“门”。在“门”虚化为复数以后,因为它只限于与人有关的表达,而且语音形式也发生了变化(丢失声调以及鼻音韵尾-m弱化),人们就加上一个“立人”偏旁以示区别。这种说法可以避免上述各位学者的假说所遇到的困难。为了帮助理解我们的论证,首先看两个有关的事实。
2.2 汉语方言复数表达的多样化和复数“家”的语法化过程
现代汉语方言里表达复数的手段是丰富多彩的,它们可以概括为以下几个类型。
(a)在很多方言里,“家”相当于普通话的“们”,表示复数。 属于这类的方言主要有山西洪洞话、临汾话(黄伯荣1996);吴方言的武进、宜兴、江阴、丹阳等方言(吕叔湘1985:89)。
(b)以轻读“都”表示代词复数,比如获嘉、邯郸、武安、 安阳等方言都是如此(黄伯荣1996:432)。
(c)以“人”作复数词尾, 比如在安徽歙县话里的“你人”相当于普通话里的“你们”(黄伯荣1996:432)。
(d )还有些是以表不定量的短语“几个”或者“那一些”表示复数,属于前者的方言有宿迁话, 属于后者的有淄博话(黄伯荣1996 :438,442)。
(e)更有趣的是,有些方言是通过变调区别单复数的, 比如山西运城话复数变为阴平长调;西安话里,“我、你、他”读上声“53”,表复数时变为“21”。临猗话和万荣话也有类似的用法(注:这种通过变调区别单复数的办法比较特殊,其成因之一可能是受复数标记的弱化、失落的影响。)(黄伯荣1996:433)。
以上这些种种表示复数的手段不大可能出自于同一个来源。这给我们一个启示,在探索普通话复数标记的产生过程时,要考虑到各种各样的可能性。虽然在“们”没有产生之前,汉语中已有表示复数概念的手段,但是它们之间并不一定有直接的演化关系。
全面地探索方言中各个复数标记的发展过程,超出了本文的研究范围。某些方言中的复数标记“家”与“们”的发展具有平行性,对我们确定“们”的起源最具启发性,所以让我们来简单看一下它的发展。
在九世纪左右的文献《敦煌变文》中,“家”有以下几类用法。
(a)表“家庭”
(4)有一家姚姓。(敦煌变文·舜子变)
(b)表“学派”、“宗派”
(5)佛家若胜。(敦煌变文·降魔)
(c)表“量词”
(6)儿还叫念百家诗。(敦煌变文·左街僧)
根据吕叔湘(1985:88),这个时期的“家”也常跟在代词之后,不过它的复数表达仍然不明确。比如:
(7)你与我传语他家。(元杂剧,引自吕叔湘1985:86)上述用法的“家”无论从意义上还是从分布上,都有可能发展成为复数标记。从意义上看,“家”的“家庭”、“学派”义都与复数概念相关;分布上看,这种用法的“家”都是跟在一个代词、名词或者数词之后组成一个名词短语,这正与它后来的复数标记的句法位置一致。然而这些用法是如何发展成为某些方言里的复数标记的,我们尚不大清楚。
2.3 复数标记“们”的语法化过程
明白了上述两个事实之后,我们就比较容易确立“们”的发展过程。在九世纪的《敦煌变文》中,“门”和“家”是同义词,比如:
(8)先代有没家门?(敦煌变文·降魔)“家门”在现代汉语里是一个复合词。那个时期的“门”几乎拥有所有“家”的用法:
(a)“家庭”
(9)一门叔父则有何大、中郎。(世说新语·贤媛)
(10)汝勿妄语,灭吾门也。(三国志·蜀书·先主传)
(b)“学派”、“宗派”
(11)佛家有三门:曰教、曰律、曰禅。(朱子语类·卷八)
(12)孔门学者亦有志不立底。(朱子语类·卷一百一十八)
(c)量词
(13)书凡九门,计两百卷。(旧唐书·杜佑传)
(14)化物门门入。(敦煌变文·维摩诘)
我们推测复数标记“们”是在以下三类具体的名词结构中开始虚化的。
(a)“人名+门”。其中的“门”表示“学派”或者“门徒”。 例如:
(15)孔门教人。(朱子语类·卷四十三)
(16)程门只有尹和靖看的出。(朱子语类·卷三十五)
(b)“代词+门”。其中的“门”多指“家庭”。例如:
(17)如何娉向他门。(敦煌变文·丑女缘起)
(18)娉与他门荣九族。(敦煌变文·父母恩重)
(c)“尊称+门”。其中的“门”也多为“家庭”。例如:
(19)范宣夫尝入公门。(世说新语·栖逸)
我们的推想得到以下几个方面的支持。第一,在中古汉语里,“家”的语义和句法行为都与“门”的相似,“家”在很多方言里变成了复数标记。不难类推“门”也有发展成复数标记的可能性。第二,“门”在该时期表示“学派”、“门徒”、“家庭”的用法都与“多数”的概念有关,因此与复数标记的意义是相通的。更重要的是,“门”的这些用法都与“人”的表达有关,这正与“们”只限于表示人的复数的事实相符。第三,“门”的上述用法都是跟在代词、人名之后,复数标记“们”在产生初期也是只能与这些词搭配。如果认为两者之间有演化关系,那么其复数标记的句法行为就很容易理解。第四,在最早的文献里,复数标记实际上也是直接写成“门”,后来才加上个“单立人”而成为“们”。 比如“他门取了富贵(道山清话)”(详见吕叔湘1949a :145—68)。书写形式的变化可能有两方面的原因, 一是复数概念跟原来的实词用法已经有了明确的差异,加上两者的语音形式也有所不同,复数的声调由于语音的弱化而失去。我们推测,为了表达得清晰明确,语言使用者就创造另外一个书写形式加以区别。
除了可写成“门”以外,复数标记在出现的初期还有别的写法,诸如“满”、“瞒”、“懑”等,例如:
(1)失笑他满恁撩乱。(克斋词,引自吕叔湘1985:56)
(2)不因你瞒番人在此。(齐东野语,引自吕叔湘1985:56)
(3)你懑只恃着大江。(黑鞑事略,引自吕叔湘1985:56)这也可能是由于作为复数标记的“门”已与原来的用法有了较大的差距,一般人已看不出它们之间的联系,就找一个业已存在的语音上近似的词加以标识。至于那些语音上差别较大的书写形式,或是同一个语素的方言变体,或是出自不同的来源,应该具体问题具体分析。
2.4 复数“们”出现的语言环境
复数概念是一个重要的交际范畴,可是在不同的语言或同一种语言的不同时期可能会用不同的方式来表示它。就汉语内部来看,在“们”出现之前,复数的概念是用各种词汇手段表示的,诸如“等”、“辈”、“曹”、“属”。然而跟这些词汇手段相比,“们”是一种稳固的语法手段,主要表现在代词表复数时必须加“们”,而且加不加“们”形成了明确的单复数对比。问题是,为什么“们”会不早不晚产生在十至十一世纪之间。纵观当时语言系统所发生的变化,这个问题就不难回答。
在十一世纪左右汉语语法系统发生了一系列重要变化,主要包括以下几类:
(a)量词系统;
(b)体标记“了”、“着”和“过”;
(c)动补结构;
(d)可能补语标记“得”;
(e)结构助词“的”;
(f)名词的后缀“子”、“儿”和“头”。上述这些语法范畴,有的是在这个时候走向成熟,有的则是刚刚引进。尽管它们的表达功能各异,它们的抽象语法结构和韵律特征是一致的:
实词(重音)+虚词(非重音)复数标记“们”也属于这些变化中的一类:它也是必须跟在一个带重音的实词之后,而自身则是一个读轻音的虚词。李讷、石毓智(1998b )比较系统地讨论了引起这一系列变化的根本机制,就不再赘言。这里我们要说的是,“们”的出现不是一种孤立的现象,它是在语言的短语结构发生重要变化的大背景下出现的。这也就回答了它出现的时机。
3.量词系统和“们”在历史上的相互制约关系
本文开头曾提到过,拥有量词系统的语言一般不能有复数标记出现在名词位置(但可以出现在定词位置);相反,在没有量词的语言里,复数标记则可以出现在名词位置上。上古汉语是没有量词的,即使在“们”出现的十一世纪,量词在数量表达中还不是必须的,半数以上的数量表达式仍不需要量词(参见李、石1998a)。 从“们”的出现到量词系统的最后建立,有四、五百年的时间,这期间“们”发展出很多用法,可是在量词系统建立以后,“们”的很多用法又逐渐消失了。这说明两类语法范畴在历史上也存在着相互竞争、相互制约的关系。
3.1“们”在十五世纪之前的迅速发展
“们”在十一至十五世纪之间发展很快,表现为用法的多样化和使用频率的急速增加。下表是我们对这个时期的两个文献的统计结果。
书名长度时间"们"的次数
《朱子语类》
约2,000,000字12世纪 78次
《老乞大》 约20,000字
14世纪180次
《老乞大》的长度只相当于《朱子语类》的百分之一,可是它的“们”的次数却是《朱子语类》的两倍半。也就是说,从十一世纪到十四世纪“们”的使用频率增加了大约五百倍!除了频率增加以外,“们”的用法也呈多样化。该时期它的主要用法跟现代汉语的一样,是跟在代词之后表复数。下面举一些当时的一些典型用例,这些用法在十五世纪之后逐渐被废弃。
(a)表约数的数量结构
(20)五六个妇人们坐的缝时。(朴通事)
(21)兄弟只带了三二百个孩儿们。(水浒传四十七回)
(b)表示数量的形容词作定语的短语
(22)咱十数个弟兄们去时勾了。(朴通事)
(23)咱几个好朋友们。(朴通事)
(c)表示动物的复数
(24)头口们怎生吃的?(老乞大)
(25)马们怎么来的迟?(朴通事)
(d)一般数量短语之后
(26)将一十七个先生每剃了头(注:在元朝的文献里,“们”经常被写成“每”。)。(白话元碑,引自吕叔湘1985:68)
(27)那三百人每尽数殄灭了。(元朝秘史, 引自吕叔湘1985 :68)上述这些用法现代汉语已经不再使用了。前两种用法出现于那个时期的各种白话文献里;后两种用法只见于朝鲜人学汉语的教材和翻译蒙古语的文献中,因此它们可能是受这些语言影响的一些书面用法。
(a)和(b)实际上都是表示约数。这些都是元明之际新兴的用法,宋代的文献《朱子语类》中尚未见到。复数标记“们”在刚出现的时候,只用于代词、人名和一些尊称之后。那么它为什么首先向表约数的数量表达式扩展呢?这跟“们”在语法化之前的意义是分不开的。人类语言语法化的一个常见现象是,一个成分语法化之前的词汇意义对它语法化之后的功能和进一步发展都有影响。“们”原来的“家庭”、“门徒”和“学派”都是表示不确定的一组人,所以在它发展成为复数标记以后,就会首先向表约数的数量式发展。那么下一步就是向普通的数量表达式扩展。但是到了十五世纪左右,量词系统已经在汉语里最后建立,每一个普通的数量表达式都需要一个量词。因为“量词”和“们”之间所存在的不相容性,“们”向量词扩展的可能性被取消了。下文还要谈到,由于受量词的制约,“们”已经发展出的用法也被淘汰掉了。
3.2“数+名+们”结构没有出现的原因
现在我们来解释文章开头提到的一个问题:为什么在历史上没有出现“数+名+们”短语?如前文所述,“们”在十至十一世纪之间出现的时候,半数左右的数量表达式仍不需要量词。因此,可以从理论上预测,“们”应该出现在没有量词的数量表达式中。但是,根据我们的广泛调查,像“三人们”这样的结构在汉语史上根本就不存在。答案还是得从“们”的来源中去找。
一个语法标记从产生到成熟,少则需要几百年,多则需要上千年的时间。它最早的用法往往是比较简单的,然后才发展出各种用法。它最早的用法取决于它所来自的语法结构。根据前文的分析,“门(们)”是在下边三类结构中被虚化的:
(a)人称代词+门
(b)人名+门
(c)尊称名词+门“们”在出现的初期,只限于用在这三类名词之后表复数(参见吕叔湘1949a)。这三类名词有一个共同的语法特点:都不能被数词修饰, 比如不能说“*三他”、“*四孔子”,尊称名词相当于一个代词,也不能为数词所修饰。“们”在开始的时候所能跟的三类词都不能被数词限制,那么就自然不可能有“数+代+们”一类的结构。等到“们”向一般名词结构扩展的时候,量词系统也已建立起来了,即没有量词的“数+名”短语成为不合法的了,至此“数+名+们”结构也就不可能再出现了。
3.3量词系统的建立对“们”功能的影响
“数+量+名”短语最早见于公元前一世纪的文献里,量词经历了一千五百多年的发展,才变成现代汉语的样子,每一个数量表达式都要求一个量词;同时,原来的没有量词的“数+名”短语被淘汰掉,变成不合法的了。这个发展过程可以从李、石(1998a )的一个统计中看出来。
文献 年代
数+名 数+量+名
世说新语
5世纪
88%12%
敦煌变文
9世纪
75%25%
朱子语类 12世纪
40%60%
老乞大14世纪1%99%
从上表可以清楚地看出带量词和不带量词的数量式的消长过程。
“们”能否出现于名词之后跟量词是密切相关的。所谓量词系统的建立,也就是它的使用范围的扩大,这就自然会限制“们”的用法。这个限制包括两个方面:一是“们”在十五世纪之前已经获得的发展趋势被抑制,比如根据前文的分析,“们”已经扩展到表约数的数量表达式,下一步可能就是向普通的数量表达式扩展,但是这个可能性被量词的建立消除了。二是“们”已经形成的一些用法也被淘汰了,比如前文提到的用于约数表达式的现象,在十五世纪之后逐渐消失了。 而且像(d)的用法——“们”用在一般数量短语和名词之后——也发展不出来了。
此外,量词和“们”的相互制约还表现在现代汉语中的互补句法分配上:
(28)a.来了两个人。
b.*两个人来了(注:编者按: 在特定场合此句是讲得通的,可接受的,如“看那边,两个人来了。”这里“两个人”是说、听者都在企盼的对象。)。
(29)a.*来了老师们。
b.老师们来了。数量词和“们”的句法对立还相当复杂,这里只以它们在存现句中的行为来说明。很明显在存现句中,单纯的数量短语只能出现在动词之后;(注:数量短语出现在动词之前时必须有标记成分,比如表有定时加指示代词:“那两个人来了”;表无定时则加“有”:“有两个人来了”。出现于动词之后的情况则不同,如果没有任何标记时则是表示“无定”的,比如“来了两个人”。)相反,光杆名词加“们”所构成的短语则只能出现于动词之前。现代汉语里,“名+们”通常出现在动词前,它在动词之后的用法受到很大的限制。但是,在十五世纪左右的文献中“们”字短语还常见于谓语动词之后:
(30)自己的钱物休爱惜,接济朋友们使著。(老乞大)
(31)我两个都已见了弟兄们。(水浒传)
(32)兄弟自带了三二百个孩儿们杀将去。(水浒传)
4.结语
现在让我们简单地总结一下文章开头提出的三个问题。首先,“数+名+们”在汉语史上没有出现的原因是,由于受其语法化的句法环境的制约,“们”在刚出现的时候只能跟在代词和人名之后,而这两类词又不能被数词修饰,所以就没有“们”用于一般数量表达式的情况;等到“们”向普通复数标记发展的时候,量词系统已牢固建立,每个数量表达式都需要一个量词,由于量词和“们”之间存在着互斥性,结果“们”进入数量结构的可能性被取消了。其次,十世纪左右发生的种种语法变化,汉语中出现了一种新的语法格式“词汇+语尾”,其韵律特征皆为“重音+非重音”,“们”也属于这类现象之一。换句话说,那时候的语言环境比较有利于像“们”这样的语法标记的出现。最后,在量词系统没有最终建立之前,“们”得到了迅速的发展,可是这种发展趋势不仅被十五世纪左右量词系统的建立抑制住,而且它已经形成的种种用法也被淘汰了。
从以上的分析可知,量词系统和复数标记“们”都不是汉语固有的,它们是在不同的时间引入的。只有从历时的角度我们才能理解,为什么汉语同时兼有这两种被认为一般不共存于同一种语言的现象,以及为什么汉语的复数标记有种种句法限制。我们从历时研究中又得到一个重要的启示:要合理地解释一个问题,必须把历时和共时的研究结合起来。