汉语词类划分的论证,本文主要内容关键词为:词类论文,汉语论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一 引言
经过多年的讨论,学者们已形成了汉语词类划分应以词的分布为依据的共识,并提出了划类的具体标准,但基本上是心目中有了类的区分再找标准,并没有对提出的标准进行有效的论证。本文打算对北京大学中文系承担的国家社科基金七五重点研究项目“现代汉语词类研究”所提出的词类系统(见郭锐1999)进行初步论证,说明选用这些分布特征划出这些词类的理由。
分布同词类的关系是错综复杂的,词类的异同并不是简单地体现为分布上的异同。本文认为,词类从本质上说是语法意义上的类,而不是分布类,分布只是词类本质的外在表现。划分词类的根本任务是确定语法功能同词类性质之间的对应关系。本文在这样的背景下来展开汉语词类划分的论证。
二 语法位置和词类的关系
2.1 什么是语法位置
我们是根据词的语法功能划分词类,首先应交待语法功能及与语法功能相关的概念。
词占据语法位置的能力是词的分布。词占据某一特定语法位置的能力是词的一个语法功能。词的分布或功能常表述为以句法成分或鉴定字、词类为环境的位置(或称为测试槽slot),如:“~宾”,“很~”,“数词~”;有时表述为句法成分,不过与以句法成分为环境的位置等价,如“谓语”等价于“主语~”。句法结构中具有一定语法关系的直接成分所处的位置是语法位置。语法位置包含了层次和语法关系信息。
Bloomfield(1926)说:结构中的每一个有次序的单位是“位置(position)”。Harris(1951)说:话语里的某个成分的环境或者位置是由它邻近的成分组成的……所谓“邻近”,是指处于该成分之前、之后或者同时出现的成分的位置。从Bloomfield和Harris的定义看,美国结构语言学的位置概念,以成分的相对顺序位置关系为基础,只看成分间的表层顺序位置关系:前、后或同时,而不考虑层次和成分间的语法关系。这样的分布概念过于表面化。语法位置之所以可以用来给成分分类,根本的原因是位置对词语有选择限制,而这种选择限制,并不是由表面上的顺序位置关系决定的,而是由层次和语法关系决定的。如:
(1)给我书——给我哥
若只考虑表层顺序位置关系,会认为“书”和“哥”处于相同位置,但实际上这两个片段层次构造不同,因而占据的是不同位置。“我哥”这个整体占据的位置相当于前一片段中“我”占据的位置。
(2)这三个苹果——这三个好吃
若不考虑语法关系,会认为“苹果”和“好吃”在这里出现于相同位置,但由于语法关系不同,两者实际上占据不同位置。
因此,在我们看来,用来定义分布的语法位置包含了层次和语法关系。
我们没有谈到顺序关系位置(之前、之后),是因为语法位置从本质上说是语法关系位置,即由语法关系决定的位置,而顺序位置倒无关紧要。
那么为什么我们讲词的分布时常表述为顺序位置关系呢?这是因为一般情况下,顺序位置反映了唯一的语法关系位置(关系和角色)。如“很~”一般是“状-中”关系。鉴定字规定的位置表面上看没有语法关系,但实际上包含了语法关系,只是没有说出,因为一般情况下语法关系是唯一的。朱德熙(1982a)说:“就印欧语而言,抓住了词类和层次,就可以在一定程度上讨论句法。因为在印欧语里词类和层次在一定程度上可以控制结构关系。”朱德熙认为这就是为什么美国结构主义不讲语法关系的原因之一。因此,句法成分和以鉴定字、词类为环境规定的语法位置这两方面可以用占据语法位置的能力统一起来。
有两方面的因素规定着成分的分布:1)直接成分间的语法关系及由此规定的直接成分的语法关系角色。2)两直接成分所组成的结构整体能出现的更大环境。比如“大型”和“大量”都可出现于“~名词”,但“大型+名”还可以出现于“数量~”,而“大量+名”不能。因此从较具体的语法位置看,“大型”和“大量”所处的语法位置不同。
2.2 语法功能的概括水平
语法位置排除了具体的语义因素,实际上是一种较为抽象的词语组合框架中的位置。而这种抽象的程度有高有低。以具体的词或某一类词为环境的位置相对来说是较具体的位置,比如:
(3)数+量
形容词+名 指示词+名
九 本 好
书
这
书
这三个例子之所以说代表了三对语法位置,表面上看是因为作为环境的成分的词类或具体词不同,但根本原因还是因为语法关系不同,只不过这是较具体的语法关系:数和计量单位的关系,性质和对象的关系,指示和对象的关系。当这些成分共现时,其占据不同语法位置表现得很明显:
(4)这九本好书*这本九好书 *书好九这本
由于具体的语法位置中的语法关系不易表述或说起来太繁琐,我们干脆直接用具体词或词类形成的环境来表述这种语法位置,而不提具体语法关系。
如果对这些语法位置进行概括,舍弃具体的语法关系的差异,只考虑主谓、述宾、偏正这样的抽象程度更高的语法关系,那么这几个语法位置又可以概括为“从属语-中心语”这样两个更抽象的语法位置。
这样我们可以说,占据以鉴定字和词类为环境规定的语法位置的能力和做句法成分的能力的不同仅是抽象程度不同。
2.3 为什么可以根据语法功能划分词类
结构中的每一个位置只能被一定的形式填充(Bloomfield 1926)。词在组合中不是随机排列的,而是有序的,这种有序性体现为语法位置对词语的选择限制,不同的语法位置允许进入的词是不同的。
组合位置对词语只要有选择限制,就一定有依据,除非组合位置对词语没有选择限制,能进入的词是任意的。比如可出现于“不~”的词都是一个陈述性成分,能出现于“数量~”的词一般是指称性成分,能出现于“在~”的词一般是表示位置的成分,能出现于“数~”的成分一般是表示计量单位的成分。语法位置对词语选择的主要依据是词的语法意义。因此根据分布划出的类从本质上说是语法意义上的类。词的语法意义的类型就是词的词类性质。可以根据语法位置对词的选择限制(即根据词的分布)反映出的词类性质对词进行分类。
划分词类从实质上说就是根据词的分布特征推断词的词类性质。有些词能出现于同一语法位置是因为具有相同的语法意义,有些词不能出现于相同位置可能是因为不具有相同的语法意义。换句话说,词的语法意义是制约词的分布的主要内在原因,词的语法意义基本上决定了词的分布,因此尽管分布不是词类的本质,但属于同一词类的成员有大致相同的分布。分布和形态一样,只是词的语法意义的外在表现。也就是说分布和词的语法意义之间有“反映-表现”关系:分布反映了词的语法意义,词的语法意义表现为分布。
2.4 分布在词类划分中有多大效力
虽然词的分布能反映词的词类性质,但分布同词类的关系是错综复杂的,表现在以下三个方面:
(一)并非只是词类性质决定词的分布,词的词汇意义、语用因素、构词方式、韵律特征等都有可能影响词的分布。
(二)有一些语法位置反映了相同的词类性质,这样的分布差异不能反映词类性质的差异。比如说“很~”和“~极了”实际上对进入的词语要求相同,两个词在这两个功能上的差异不反映词类性质的不同。
(三)有一些语法位置可能允许多种词类性质进入。比如主语位置上既可以出现名词,也可以出现动词(去是应该的)、形容词(骄傲使人落后)、区别词(急性好治)等,谓语位置上可以出现动词、形容词、状态词,也可以出现名词(今天阴天)等。
因此,词类的异同不是简单地体现为分布上的异同,“所有具有相同功能的形式组成一个形类(form-class)”(Bloomfield 1926)的说法不能成立,不可能纯粹根据词在分布上的相似性划分词类。我们根据“主、宾、谓、补、~宾、定、状、不~、很~、数~、在~”等36项语法功能对有选择地抽取的60个词进行了分布考察,结果发现只有四对词(人-桶,岁数-举动,慢性-私人,究竟-亲自)的分布在36项功能上相同;按照分布相似度的聚类分析(cluster analysis),结果与一般的词类划分差别很大,比如与状态词“花白”在分布相似度上最接近的10个词是“日常、临时、野生、慢性、私人、众多、相同、注定、个别、钢笔”,按平均连接法,首先与通常划为区别词的那些词聚成一个类;而与动词“着想”在分布相似度上最接近的10个词是“荣幸、酷热、注定、休息、野生、相同、洗、花白、慢性、亲爱”,按平均连接法,首先与通常划为形容词的“荣幸”聚在一起,然后才与及物动词“注定”聚在一起。
也就是说,词的分布并不能完全决定词类性质的推断。但毕竟词的词类性质是制约词的分布的主要因素,而词的语法意义又不可直接观察,分布仍是我们划分词类性质的根本依据。我们既要依赖词的分布推断词类性质,又要通过一些手段排除影响词的分布的非语法意义因素,以及词类性质与语法位置的不完全对应带来的干扰,在词类性质与词的分布的错综复杂的关系中寻找到词类与分布的对应关系,从而根据分布合理而有理据地划分出词类。
三 功能的相容性和划类标准的选择
3.1 语法功能的划类价值
之所以可以根据词的分布特征划分词类,是因为有的功能之间的差异指示了词类性质的差异,比如词a具有“不~”的功能,不具有“定语~”的功能,词b正好相反,那么可以推断词a是谓词,而词b是体词,这样的一对语法功能可以叫作异价功能;而有些功能之间的差异并不指示词类性质的不同,比如词c只具有“主语”的功能,词d只具有“宾语”的功能,两词都是名词,这样的功能可以叫等价功能,即反映了相同词类性质的多个语法功能。由于等价功能间没有区分词类性质的作用,因而可以把等价功能作为析取性标准用来划分同一个词类。比如析取性标准“主语|宾语|定~”可以作为划分体词的标准。等价功能的存在表明,并非任何分布上的差异都反映词类性质的差异。
等价功能是传递的,由此形成一束等价功能。一束等价功能实际上就是一个词类的区别性功能。所谓区别性功能指能体现某类词的词类性质的功能,比如等价功能束“不~”、“没~”、“谓语”、“~宾”、“~补”体现了动词的性质,“主”、“宾”、“定~”体现了名词的性质,“很~”、“很不~”、“*很~宾”体现了形容词的性质。不同的词类,其区别性功能不同。比如“主”对于动词、形容词来说就不是区别性功能。严格地说,所谓区别性功能就是反映了某类词的本质(语法意义)的功能,比如名词的本质是指称,“主”“宾”“定~”就反映了指称的性质;动词的本质是陈述,“不”“谓语”“~宾”就反映了陈述的性质。
也就是说,不同的功能对于不同的词类,具有不同的划类价值:有的是区别性的,有的是非区别性的。因此,不能把一个词类的所有功能等量齐观,我们只选择那些区别性功能来划类,这就是我们只选择部分分布特征作为划类标准的原因。根据语法位置对词语的选择限制理论,词语之所以有分布的不同,根本原因是词语本身有语法意义上的差异,因此词类在本质上是词在语法意义上的类,分布只是语法意义的外在表现,而分布特征的差异有的是区别性的,有的是非区别性的,因此,不可能纯粹根据分布上的相似性划分词类,而只能选择部分分布特征即区别性分布特征作为划类标准。
从理论上说,如果能够找出所有的功能,并且确定哪些功能间是等价的,就把语法功能聚成了一束一束的等价功能,当得到这个结果时,我们也就找出了所有词类的区别性功能,实际上也就基本上把所有的词分成了不同的类。因此确定等价功能就成了寻找划类标准和确定一种语言中有多少词类的关键。
3.2 语法功能的相容性和等价功能的确定
3.2.1 功能的相容性能提供什么信息
既然划类标准要从区别性功能中选择,那么确定等价功能就成了划分词类的关键。如何确定等价功能?可以利用功能的相容性来确定功能的划类价值,以此找出具有区分词性作用的功能,从中选择划类标准。
功能的相容性(compatibility)指同一批词共有两个或多个语法功能的性质,比如能做主语的词也能做宾语,反过来能做宾语的词也能做主语;能进入“很~”的词也能进入“~极了”、“~得很”,能进入“~极了”“~得很”的词也能进入“很~”。而另一些功能之间相容性极小,如“不~”和“数~”,“数量~”和“状”。如果两个功能之间有很高的相容性,那么意味着什么呢?如果两个功能之间相容性极低,又意味着什么呢?前面我们说到,语法位置对词语选择限制的根本依据是词语的语法意义,因此具有较大相容性的功能往往反映了这两个不同的语法位置对词语的选择限制相同,即两个语法位置对词语语法意义的要求相同,反映了共同的词类性质,因而是等价功能。相容性较小或无相容性的两个功能反映不同词类性质,一般是异价功能。因此,我们可以根据功能的相容性来判断语法功能的划类价值。
3.2.2 相容度的计算和汉语主要功能间的相容度
我们是这样计算相容度的:设0≤C≤1,功能x相对于功能y的单向相容度(Cx-y)、功能y相对于功能x的单向相容度(Cy-x)和功能x和功能y的总相容度(Cx*y)的计算公式为:
(8) Cx-y=xy重合词数/x词数 (9) Cy-x=xy重合词数/y词数
(10) Cx*y=xy重合词数/(x词数+y词数-xy重合词数)
例如,若具有功能x的词100个,具有功能y的词40个,其中只有x的词80个,只有y的词20个,兼有x和y的词20个,相容度为:
Cx-y=20/100=0.2 Cy-x=20/40=0.5
总相容度意义不大。例如,若具有功能x的词100个,具有功能y的词20个,其中只有x的词80个,兼有x和y的词20个,则总相容度为:Cx*y=20/(100+20-20)=20/100=0.2。总相容度虽然能反映出x相对于y的相容度,但不能反映y相对于x的相容度:Cy-x=20/20=1。
我们用上述办法计算了汉语实词主要功能之间的相容度(见下页表1)。
说明:1.带*的功能的词数是根据抽样统计的比例推算得出的。2.相容度等级的临界值:高相容度(+):C≥0.5,其中包括极高相容度(+ +):C≥0.9;低相容度(-):C<0.5,其中包括极低相容度(- -):C<0.1。3.表中“x&y”表示具有功能x并且具有功能y的词数。4.“等价”一栏中“+”表示等价,“-”表示不等价,“-?”表示相容度高于0.5,但根据相关规则应判为不等价,“+?”表示相容度低于0.5但根据相关规则应判为等价。
3.2.3 等价功能的确定方法
等价功能基本可以由分布的相容度来确定,不过由于词的分布虽然主要由词的词类性质决定,但同时语义、语用、韵律、构词方式等其他因素也会对词的分布造成影响,另外某些语法位置可能允许多种词类性质进入,有一些词可能具有多种词类性质,因此不能完全靠功能的相容度确定功能的划类价值,还需要考虑其他因素,排除其他因素造成的功能相容性的干扰。
我们按下列规则判断语法功能之间的等价关系:
规:若两个功能的单向相容度小于0.5(C<0.5),则基本可推测两个功能反映不同词类性质,是异价功能;①若一个词兼有这两种功能,则可认为这个词兼有两种词类性质;但若某项功能可以找出条件,可以适当类推,那么不能认为这些词具有多种词类性质,是语法位置允许多种词类性质进入造成的;如果两个功能的任一单向相容度大于0.5(C>0.5),则需经过规则2-4的检验。
比如“不~&定”、“不~&状”、“定&状”,各单项相容度都小于0.5,可视为异价功能。而“数量~&状”,虽然各项相容度都小于0.1,但能受数量词修饰的词做状语可以找出条件并可适当类推,主要有三种:一是表示比喻,如“拳头大、碗口粗”;二是表示方式、工具,如“电话采访、公款请客、掌声鼓励”;三是表示处所,如“操场去、学校见、主场迎战对手”。可以找出条件并适当类推的功能是句法现象,不是词汇现象,因此不能认为这些词具有副词性质。换句话说,状语位置也允许一部分名词性成分进入。
规:若在其他语法位置上,具有其中一项功能的词和不具有这项功能的词表现出较大差异,说明功能的相容性是由语法位置允许多种词类性质进入和一个词具有多种词类性质造成,不能推断是等价功能;若在其他位置上不表现较大差异,则可推断是等价功能。
比如,“不|没~&主|宾”,单项相容度分别为0.58和0.2,但在“数量~”和谓语、补语位置上,表现出较大差异,能进入“不~”的词一般也能进入“谓、~补”,不能进入“数量~”,而不能进入“不~”的词大多能进入“数量~”,不能进入“谓、~补”,因此可以推断相容性是由“主|宾”这个位置允许多种词性进入造成。
规:若具有功能x的词和具有功能y的词有相当一部分在其中一项功能上能构成偏正结构,则可推断x和y的相容性是由部分词具有多重词性造成,无法断定是等价功能。比如,“数量~&定”、“主宾&定”(桌子、节目-木头、电视)两对功能相容度最高分别达到0.75和0.94,但可构成直接成分“木头桌子”、“电视节目”,因此可推断“木头”、“电视”具有多重词类性质,不能断定两功能等价。
提出这一规则,是因为我们发现处在偏正结构修饰语和中心语位置上的同一词形具有很不同的句法表现,比如:
(11)a.也干净 也不干净、也很干净
b.干净衣服*不干净衣服、*很干净衣服
(12)a.都认真 都不认真、都很认真
b.认真学习*(不认真)学习、很认真学习
(13)a.我的木头我的十根木头
b.木头房子*十根木头房子
“干净”、“认真”在中心语位置上可以受状语修饰,其性质与在谓语位置上相同,但在修饰语位置上不能受状语修饰,表明两者性质有异;“木头”在中心语位置上可以受数量短语修饰,与在主宾语位置上相同,而在定语位置上不能再受数量短语修饰,说明性质有变(参看吕叔湘1979,张伯江1994,郭锐1997)。从语法意义看,“干净”、“认真”在中心语位置上是陈述,与谓语位置上相同,而在定语、状语位置上是修饰;“木头”在中心语位置上是指称,与主语、宾语位置上相同,而在定语位置上是修饰(参看郭锐1997)。
规:若x和y重合的词数随词频降低而明显减少,则可推断x和y的相关性由一些词具有多重词类性质造成。
提出这一规则,是因为我们发现,这种现象是由于其中一项功能出现词数随词频下降而显著下降,另一项功能则与词频无显著相关或呈负相关,比如表2显示,“很~”同“定”的相容度与词频呈正相关,原因是其中具有“定”的词数与随词频下降而显著下降,而“很~”不但不随词频下降而下降,反而上升,呈负相关;与之形成对比的是“很~”同“不~”、“很~”同“~着了过”的相容度与词频不呈正相关。同时,我们也发现,兼类词同词频也呈显著正相关(见表3),我们可以说词所具有的词类性质的多少与词频正相关,因此有理由认为两项功能的相容性是由一些词具有多种词类性质(兼词性)造成。
规:等价功能具有传递性,如果功能x与功能y等价,功能y与功能z等价,那么功能x也与功能z等价,由此可形成等价功能束。有些功能间虽然相容度小于0.5,但由于分别与某个相同功能等价,两功能可由这种传递性赋予等价性。比如“很~&粘补”、“很~&~真宾”两对功能的相容度均小于0.5,但“很~”与“不|没~”等价,而“不|没~”与“粘补”、“~真宾”又等价,根据传递性“很~”和“粘补”、“~真宾”也等价。
规:语法功能的概括水平与所反映的词类性质的概括水平相一致,等价束中概括水平低的功能可以根据上述5条规则确定同等概括水平的等价功能,代表不同的次类;如果等价束中某概括水平高的功能与概括水平低的功能间形成单项相容度悬殊的情况,则概括水平低的功能可能代表了一个次类,应参考重叠形式等其他特征考虑是否划出次类。
上文说到句法成分这样的功能比以具体的词或词类为环境的功能概括水平更高,前者反映的词类性质的概括水平也高于后者。比如概括水平高的等价功能“主|宾|定~”反映的是体词性,而概括水平低的“数~”与“在~”相容度为0.01和0,在低概括水平的功能上是异价的,代表了两个次类。又如“很~&谓语”的单项相容度分别是0.99和0.19,两者悬殊,“很~”是概括水平低的功能,反映了次类的存在。
3.3 汉语实词划分标准
3.3.1 实词的大类划分
按上述规则确定汉语语法功能的等价性,可以形成以下等价束:
等价:不~,没~,~着了过,谓语,补语,~补,~真宾,~准宾,状语~,很~,很不~,~极了,~得很
等价:主语,宾语,定~,数量~
等价:修饰语③
等价代表了谓词,等价
代表了体词,等价
代表了饰词。
但等价功能束还不是划类标准,因为某些语法位置可能允许多种词性进入,因此等价束虽然具有对内的普遍性,但不具有对外的排他性。这一点可以用不等价功能共现来证明,如不等价的“不~”和“主”可以共现,④如“不去是应该的”。那么,如何判断是哪一个位置允许多种词性进入?可以通过共现功能的层次性来判断:处于外层的功能允许多种词性进入。在这种情况下,词性的判断应优先考虑内层功能。比如“不//去/是应该的”,那么可以断定处于外层的“主语”功能允许多种词性进入,“去”应按“不~”归入谓词;“谓”和“定~”不等价,但可共现,如“小王/黄//头发”,谓语功能在外层,因此,可以认为谓语位置允许多种词性进入,“头发”应按内层功能“定~”归入体词。又如,“定~”和“状~”不等价,但可以共现,如:
(14)a.这本书的/及时//出版b.*及时/这本书的//出版
(15)a.(小王)也/黄//头发 b.*(小王)黄/也//头发
这两例表明,“定~”和“状~”都允许多种词性进入,“出版”按内层功能“状~”归入谓词,“头发”按内层功能归入体词。(参看郭锐2000)
也就是说,等价功能束只表明同一束内的功能之间无区别词性作用。划类标准要从等价束中选择,并对允许多种词性进入的位置加以限制,使划类标准具有对外的排他性。比如能做主语或宾语、受定语修饰并且不以等价的功能为内层功能的词才归为体词。此外,划类标准还与划类策略有关,这个问题我们将另文讨论,本文假定划类策略已经解决。在作了上述考虑后,各大类实词划分标准可制定如下:⑤
谓词:不~|没~|很 ~|很不~|~宾|~补|补|(谓∧*定~)
体词:主|真宾|定~∧*谓词
饰词:修饰语∧*(谓词|体词)
3.3.2 基本类的划分
3.3.2.1 根据规,语法功能的概括水平与所反映的词类性质的概括水平相一致,因此上述同一等价束功能所确定的谓词、体词、饰词内部还可以根据概括水平低的等价功能束进一步分出名词、动词这样的基本类。我们同样根据功能间的相容度及相关规则推断功能的划类价值,下面先看饰词主要功能间的相容度(表4)。
这里首先要澄清一个问题,就是我们用来定义语法功能的环境用到了词类概念,如“数~”、“~方位”,那么是否有循环论证的问题呢?循环的问题可以用先列举出类的全体或部分成员的办法解决。而白硕(1995)则根据不动点理论证明,从理论上说以尚未定义的词类为环境来划分词类并不存在逻辑循环问题。
从本文的角度看,以词类为环境也不存在逻辑上的循环论证。前面我们说到,语法位置指句法结构中具有一定语法关系的直接成分所处的位置,以词类为环境的语法位置从根本上说仍是由结构关系决定的,比如“数X”指有“数值-计量单位”关系的偏正结构,以词类来定义环境的实质是以词类组合代表的特定语法关系来定义环境,而语法关系是独立于词类的。
3.3.2.2 饰词内部,比“修饰语”更具体的功能“定”和“状”的相容度分别为0.01和0.19,可以断定不等价,由此形成两个等价束:
等价:定语等价
:状语
由此可以把饰词分为限定词和副词:
限定词:定语∧*(谓词|体词)
副词:状语∧*(谓词|体词) {马上、亲自、特意、也}
限定词内部,比定语功能概括水平低的功能“~量”(三个)、“~X的名”(所有迟到的学生)、“~数量名”(这三个学生)、“数量~名”(三台黑白电视)之间的相容度很低,基本可以断定是不等价功能,由此再把限定词分为四类:
数词:~量∧*(谓词|~(数+量+名))
{一、几、半、十}
指示词:~(数+量+名)∧*(谓词|体词) {每、任何、其他、这}
数量词:~X的名∧*~(数+量+名) {许多、一切、所有、俩}
区别词:数量~名∧*(谓词|体词) {高等、公共、野生、日常}
这四类限定词的标准的后半部分用负值的合取性标准是为了把也可能具有前半部功能的其他词类排除。数词标准中,“~量”位置上也可以出现形容词、指示词(大块、每台),因此需要用“*(谓词|~(数+量+名)”排除;指示词标准中,“~(数+量+名)”位置上还可以出现谓词(雪白一双鞋),虽一般不出现体词,但保险起见,应把体词和谓词一起排除;数量词标准中,“~X的名”位置上还可以出现指示词,我们用“*~(数+量+名)”排除;区别词标准中,“数量~名”位置上也可出现体词、谓词,我们用“*(谓词|体词)”排除。
数量词从语法意义上看表示数量,其整体功能实际上与“数词+量词”构成的短语相同,这是我们命名为数量词的原因。比较:
许多迟到的学生~十个迟到的学生来了三个~来了许多。
饰词中,可以做状语的实际有两类词,一类总是在被修饰的成分前面做状语,我们归为副词,另一类通常放在被修饰成分的后面,朱德熙(1982b)叫准宾语,如“高一点”、“等候片刻”、“沉思许久”,但在否定表达中一般放在前面,“一点也不高”、“片刻不得安宁”、“许久未来”,我们认为准宾语严格说实际上是一种修饰语,从语法关系上说与放在前面的状语相同,可以叫后状语(参看郭锐1997)。“许久、片刻”这一类词的语法意义实际上也是数量,其语法功能与另一些数量短语相同,比较:等了三天/等了许久、高两厘米/高一点。而且有些词实际上既可出现于“~X的名”,又可出现于后状语位置,如“一些、许多、很多、不少、片刻、一点”。因此,可以把出现于后状语位置上的词也归为数量词。这样看来,数量词内部的性质并不完全一致,有的只具有限定词性(一切、所有、少许、俩),有的只具有副词性(许久、良久、不久),有的既具有限定词性,又具有副词性(一些、许多、片刻、丝毫)。数量词标准可修改为:~X的名|准宾∧*~(数+量+名)。
3.3.2.3 体词内部,“数量~”和“~方位”相容度很高,根据3.2.3提出的规则,可以断定是等价功能,“在[实词]~”⑥和“数量~”、“在[实词]~”和“~方位”相容度也超过0.5,但这两对功能与词频显著正相关(见表5),其中“在[实词]~”随词频下降而显著下降,而“数量~”、“~方位”与词频无显著相关,根据规,可以认为相容性是由能进入“在[实词]~”的词具有多重词性造成,不能认为这两对功能等价。
这样,体词内部形成三个等价束:
等价:数~ 等价
:在[实词]~等价
:数量~、~方位由此分出量词、位置词、名词。标准如下:
量词:(一|几)~∧*(主|数量~) {个、次、年、斤}
位置词:在[实词]~∧*~(上|里|以南)
名词:主|真宾|定~|~方位∧*(谓词|量词|位置词) {桌子、电视、面积、地步}
量词标准中,有些名词可进入“(一|几)~”,如“这一地区、几兄弟”,所以用“*(主|数量~)”排除。位置词标准中,有些名词也能进入“在[实词]~”,如“在教室、在北京、在操场”,但这些词还能进入“~方位”,可以认为这些词兼有名词和位置词词性,我们这里按同型策略不处理为兼类,而划入名词,用“*~(上|里|以南)”是为了把这一部分名词排除。用来划分名词的标准中有“主”“真宾”“定~”这样的概括水平较高的功能,是因为“数量~”“~方位”没有对内的普遍性,而名词实际上是体词中的剩余类,所以可以用体词中剔除量词、位置词的办法来划分名词。
位置词内部还可以划出方位词、处所词、时间词,其划分仍可以用本文提出的方法论证,但限于篇幅,论证从略,此处只列出划分标准:
方位词:在(体词~)∧*~(上|里|以南)
{后头、周围、以前、附近}
时间词:(在~∧等到~|~以来|~的时候)∧*(谓词|名词) {刚才、去年、最近、拂晓}
处所词:在~∧*(~(上|里|以南)|时间词)
{野外、原地、一旁、民间}
3.3.2.4 谓词内部“很~”和“谓语”的相容度分别为0.99和0.19,两者悬殊,概括水平不同,根据规,“很~”可能代表了一个次类,考察其他句法形态特征,发现刚好能进入“很~”的双音、单音谓词的重叠形式大多分别为AABB式和AA(不轻声)式,而不能进入“很~”的双音、单音谓词的重叠形式大多分别为ABAB式和AA(轻声)式,因此可以认为“很~”及与其有极高相容度的“~得很”、“~极了”、“很不~”代表了谓词内一个与其他谓词相区别的次类。“很~”和“~真宾”的相容度极低,分别为0.08和0.03,而能进入“~真宾”的词的重叠形式大多也是ABAB式和AA(轻声)式,所以尽管根据等价的传递性,这两个功能在较高概括水平上是等价的(“很~”与“不~”等价,“不~”与“~真宾”等价),但在较低概括水平上是不等价的。至于“很~”和“~真宾”共现的情况(如“很喜欢他”),由于“~真宾”在内层,因此应按“~真宾”优先的原则归为动词。形容词划分标准如下:
形容词:很[不]~∧*(很~宾) {红、大、干净、认真}
那些能进入“很~”的词相当一部分可以进入“~真宾”,有两种情况,第一种是表示程度比较,只出现于“~真宾(比较对象)+准宾”,如“高他一头”、“大他一岁”,其程度性与形容词的程度性正相吻合;第二种表示整体的某个部分出现某种变化,主语和宾语有整体和部分的关系,如“(脸)红了半边”、“(手上)黑了一块”、“(你我)都白了头发”。在较低概括水平上“很~”和“~真宾”不等价,但这种现象可以找出条件并适当类推,根据规应认为是句法现象,仍是形容词的功能,不能看作变成了动词。
剩下的动词和状态词之间的划分的证明则较为困难,主要原因是状态词是一个功能狭窄的类,没有什么特殊的功能,而动词的个体差异又较大,很难通过功能的等价性把两类划开。不过,排除了形容词的双音谓词,尽管重叠形式大多是ABAB,但其语法意义和语音形式不同,“调整、请示、商量、研究”等重叠形式后半部分轻读,语法意义表示小量;而“雪白、通红、矮胖、干瘦”重叠形式不轻读,语法意义表示程度加深。前者大多能进入“不~”、“没~”、“~宾”、“~补”、“~着|了|过”,而后者不能,因此可以把两类谓词划开:
动词:不~|没~|~宾|~补|粘补|(~着|了|过)∧*形容词{吃、看、研究、应该}状态词:组补|谓∧*(动词|形容词) {通红、花白、酷热、卓然}状态词大多是形容词的量化形式,不少人据此认为应把状态词归为形容词。但从形容词到相应的量化形式是一种构词形式而不是构形形式,也不是句法现象,而且与形容词在句法特征上差别显著,特别是不再具有形容词的本质功能“很[不]~”,因此应单独划为一类词。
3.3.2.5 以上的讨论中,15个实词类我们讨论了13个,还有代词和拟声词没有讨论。代词实际上是从话语功能的角度分出的类,严格地说与其他词类不在一个层面上,从一般意义上的词类角度看,代词应分别归入体词、谓词和饰词以及更小的基本类中去,这里不再讨论。拟声词是一个特殊的词类,对它在词类体系中的地位我们还缺乏足够的认识,尚不清楚如何用本文的方法来论证。
四 结语
词类从本质上说是词在语法意义上的类,不是分布类。不可能简单地根据分布上的相似性划分词类。但分布是词类性质的外在表现,可以通过确定分布同词性的对应关系来推断词性,而这种对应关系可以根据语法功能间的相容性及相关规则来确定,从而把语法功能聚集成等价束,找到各类词的划分标准。然而,分布毕竟不是词类的本质,多种因素影响词的分布,以分布特征为标准划分词类也有局限。比如,有两种一般只能做谓语的词,一是“交加、倍增、参半、奇缺”,这些词一般归为动词;二是“旖旎、婆娑、皑皑、卓然”,这些词一般归为状态词,但从语法功能上说两者难以分开。尽管如此,根据词的分布特征仍能把绝大多数划入相应词类。
作为词类本质的语法意义指词的表义模式,也可以叫“表述功能”,如陈述、指称(实体、位置、计量单位等)、修饰等。我们把实词分出13个类,这13个类都有自己的语法意义:名词表示实体指称,位置词表示位置指称(处所词表示绝对空间位置指称,时间词表示绝对时间位置指称,方位词表示相对位置指称),量词表示计量单位或等级单位,形容词表示性质陈述,状态词表示量化性质(状态)陈述,动词表示行为动作、关系、状态的陈述,数词表示数值修饰,数量词表示数量修饰,指示词表示指示修饰,区别词表示分类性修饰,副词表示情状修饰。词的语法意义是制约词的分布的根本因素,这是我们可以根据分布划分词类的原因。
笔者放弃曾坚信多年的分布本质的词类观,是因为在长期的词类考察研究工作中,发现分布本质的词类观难以自圆其说。而语法意义本质的词类观可以自圆其说,又能以此为出发点根据分布同词性的对应关系来确定划类系统、选择划类标准,使词类划分成为可论证的。我们的注意力不是放在寻找对内有普遍性、对外有排他性的单项分布特征和分布的相似性上,而是放在通过分布和语法意义之间的“反映-表现”关系,把具有相同划类价值的语法功能聚集成束,从而找到划类标准。这种方法与朱德熙先生一贯倡导的形式和意义相互验证的方法是一致的,即我们主张最大限度地寻求形式和意义的相互契合,认为只有形式和意义相互契合的东西才是语言系统中真实存在的东西。把语法意义看作词类本质,那么既有意义这一头,又有形式这一头(分布特征),两者契合,这就是词类。正是本着这种观念,本文严格地以分布标准划分词类。因此,虽然本文认为词类从本质上说不是分布类,但在划类中可能比坚持分布本质词类观的学者更倚重分布。
附 注
①根据上文提出的假设,极高相容度的功能才是等价功能,这里以相容度小于0.5为推断异价功能的标准是为了稳妥。
②多义词、同形词的多个词条只作为一个词条统计,因此统计词数(38110)少于总词数(43330)。
③本文分别统计了定语和状语与其他功能的相容度,未把两者合为“修饰语”统计,但具有状语功能的词很少,定语的情况基本代表了修饰语的情况。
④我们把短语整体的功能算作该短语核心成分(head)的功能。比如“大苹果好吃”中“苹果”做主语;“我马上去图书馆”中,“去”做谓语。
⑤使用这些标准时,应排除省略和转指的用法,如“我不”是省略用法,不能认为“不”做谓语而归入谓词,“许多都坏了”中“许多”是转指用法,不能认为“许多”做主语而归入体词。
⑥“[ ]”表示可以不出现的成分。