词类范畴的家族相似性*,本文主要内容关键词为:词类论文,相似性论文,范畴论文,家族论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
本文指出汉语词类是一种原型范畴,是人们根据词与词之间在分布上的家族相似性而聚集成类的。由于同一词类的词不一定共有一项/组为其他词类所无的分布特征,因而无法用几项分布特征之间的合取/析取关系作为标准来给所有的词分类和给不同的词类下定义。本文提出,属于同一词类的词有典型成员和非典型成员之别,典型成员是一类词的原型,是非典型成员归类时的参照标准。其典型成员在分布上往往共有一组分布特征,可以通过典型成员的分布特征来给词分类和给不同的词类下定义。但是,不同词类的典型成员在分布上的差别比较明显,不同词类的非典型成员在分布上的差别比较模糊,这造成了汉语的词可以分类但又难以分类的复杂局面。作者认为,根据原型范畴化理论,运用词分布上的优势劣势之别,给词分类,给不同的词类下出宽泛定义,辅以严格定义,是一个比较现实、周全的做法。最后,作者给出了一个基于原型理论的汉语词类系统。
§0 解题
词类范畴的家族相似性,是一种比喻的说法①。意思是:属于同一词类的各个词在语法性质上有程度不同的相似性,其中有些词在分布上有较多的相似性,它们成为这一类词的典型成员,而有些词跟其他词在分布上相似性较少,它们成为这一类词的非典型成员。这也就是说,词类是一种原型(prototype)范畴,是人们根据词与词之间在语法性质上的种种相似性而概括出来的。
本文借鉴认知心理学上的原型理论②,讨论汉语词的分类问题,最后给出一个基于原型理论的汉语词类系统。
§1 词类划分的两难局面
词类是反映词的语法功能的类,所以只能根据词的语法分布来划分词类。由于词的全部分布(total distribution)是很复杂的,其中不少分布是不同类别的词共有的(比如,体词和谓词都可以做主、宾语,都可以受数量词修饰);因而语言学家通常只选择一两项具有区别意义的分布特征作为分类标准。比如,朱德熙说;“谓词包括动词和形容词两类。我们用来划分动词和形容词的标准有以下两项:
(1)前边能不能加‘很’,(2)后边能不能带宾语。
……根据这样的划类标准,我们可以把形容词和动词分别定义为:
(1)凡受‘很’修饰而不能带宾语的谓词是形容词。
(2)凡不受‘很’修饰或能带宾语的谓词是动词。”③
在这里,朱先生没有用严格的分布标准规定谓词的范围。就算谓词的界限是明确的,那么用上面的划类标准能不能把动词和形容词区别开来呢?事实证明是很困难的,因为存在着这样两个语言事实:(一)并不是所有的形容词都能受“很”修饰,比如:“煞白、冰凉、通红、喷香、粉碎、稀烂、精光……”等状态形容词本身已经表示了某种程度,所以不能受程度副词“很”修饰。但是根据上面的定义(2),这些形容词只能划到动词中去。(二)形容词不是绝对地不能带宾语,例如④:
红着脸 红了脸 红过脸
空着手 空过手 斜着身子
粗着脖子粗过脖子扁着嘴巴
聋了耳朵瞎了眼睛坏了事了
一下子黄了脸 不要脏了我的手
高你一头大他三岁忙了你一天
根据上面的定义(2),这些形容词就应该划到动词中去。由此可见,关于形容词的定义(1)对形容词内部没有普遍性(即不能概括全部形容词),它只能管住性质形容词,但管不住状态形容词;关于动词的定义(2)对形容词没有排他性,它把动词以外的一部分形容词也划了进来。
朱德熙说:“名词的语法特点是:(1)可以受数量词修饰,例如:一支笔、三本书、几件事、一种风气;(2)不受副词修饰:*很勇气(比较:很勇敢),*早战争(比较:早打仗),*不青年(比较:不年青)”⑤。朱先生所说的名词是一个比较纯净的类,已经把时间词、处所词和方位词排除在外了。那么能不能用上面两个关于名词的语法特点作为划定名词范围的标准呢?事实上是很困难的。撇开“皮肤”、“体育”等零星的一般名词不受数量词修饰不说⑥,整个专有名词这一小类在一般情况下就不受数量词修饰。因此,我们不能说:名词是能受数量词修饰而不受副词修饰的一类词。
朱德熙把副词定义为“只能充任状语的虚词”,并且说:“副词只能作状语,不能作定语、谓语和补语”⑦。事实上,像“很”、“极”等少数副词不仅能作状语,而且还能作补语。例如:
很棒~棒得很 极好~好极了
可见,上面关于副词的定义偏紧,把“很”、“极”等老牌的副词排除在外了。而且,这个定义对少数只能作程度补语的副词(如:透、透顶)也缺少概括力⑧。
上面的讨论集中地反映了词类划分的两难局面:一方面,不得不根据分布来给词分类;另一方面,彻底的分布主义的操作路线很难贯彻到底。这在代词这一类上表现得尤为明显,如果纯粹考虑分布,就根本得不到代词这样一个类。因为从分布上看,有的代词(如:你、我、他、什么)接近于体词,有的代词(如:这么样、怎么样)接近于谓词,像“怎么”甚至还能带宾语(如:我能怎么你呢?)。
§2 特征范畴和原型范畴
上文指出朱先生用来作为名词、动词、形容词和副词的分类标准的几项分布特征并不能真正地把这几类词划分清楚,那么换几条分布特征作为分类标准行不行呢?我们做了各种尝试,结果是:不管你选用什么分布特征作为分类标准,都很难做到真正地把属于同一类的词都划进来,把属于不同类的词都划出去。这就使我们从根本上怀疑:凭两三条分布特征的合取/析取关系能否把词类划分清楚?词类到底是特征范畴还是原型范畴?
经典的范畴化理论是根据特征进行概括的,它的一个基本假定是:范畴是根据一组充分必要特征/条件来下定义的⑨。这种理论还有以下这些假定:(1)特征是两分的,某一范畴具有或没有某一特征泾渭分明;(2)范畴之间有明确的边界;(3)同一范畴内的成员地位相等。这种根据共有特征而概括出来的范畴就是特征范畴(feature-based category)。比如,数学上的素数就是一个特征范畴,只要属于这一范畴的整数都有这样一个特征:只能被1和它本身整除。
与此相反,基于原型的现代范畴化理论认为:范畴不一定能用一组充分必要特征/条件来下定义,在区别一个范畴时,没有一个属性是必要的。实体的范畴化是建立在好的、清楚的样本(exemplar)的基础之上的,然后将其他实例根据它们跟这些好的、清楚的样本在某些/一组属性上的相似性而归入该范畴。这些好的、清楚的样本就是典型(即原型),它们是非典型事例范畴化的参照点。这种根据与典型事例类比而得出的范畴就是原型范畴(prototype-based category)。这种理论还有以下假定:(1)实体(entity)是根据它们的属性(attributes)来加以范畴化的,但这些属性并不是经典的范畴化理论中的那种两分的理论构件,而经常是个连续的标度;(2)范畴的边界是模糊的、不固定的;(3)同一范畴内的成员在说话人的心目中地位并不相等,有较好的样本与较差的样本之分,即成员资格有等级之分,较好的样本是这一范畴的典型成员,较差的样本是这一范畴的非典型成员。比如,苹果、梨、桃、橘子、樱桃、枇杷、杏子、香蕉、荔枝、菠萝、桑椹、杨梅、草莓、椰子、甘蔗、荸荠、西瓜、西红柿、橄榄……都属于水果这一范畴,但是没有一个特征是所有这些水果共同具有的。显然,水果作为一个类,并不是因为每一种水果都具有水果的共同特征,而是因为每一种水果都和其他几种水果有一些家族相似性(family resemblance)。相似性越大的,在这一类事物中越占中心的位置,即成为这一类的典型成员。比如,苹果、梨、桃、橘子等是水果这一范畴的典型成员。有些事物和其他同类的事物相似性较少,它的典型性就差,即成为这一类的非典型成员。比如,椰子、甘蔗、荸荠、橄榄等是水平的非典型成员。同时,如果某一范畴的非典型成员又和其他范畴的典型成员具有一定的相似性,那么这种事物就处在两个类的边界。例如,西红柿有时可以称为水果,有时又可以称为蔬菜;它既不是水果这一范畴的典型成员,也不是蔬菜这一范畴的典型成员⑩。
现在的词类划分工作基本上是以经典的范畴化理论为逻辑背景的。比如,通常认为某一词类的全体成员一定共有或没有某一分布特征,可以用这种具有区别性价值的分布特征来给不同的词类下定义;往往希望一类词跟另一类词有明确的界限,并且默认同一词类中的词地位相等,没有典型成员和非典型成员之别。这种追求简单、整齐的科学理想在实际的词类划分工作中往往行不通,因为词类不完全是特征范畴。在很大程度上词类是原型范畴。比如,尽管找不到一条为形容词所独有、为其他词类所无的分布特征,但还是可以根据“煞白、冰凉、通红、喷香、粉碎、稀烂、精光……”等状态形容词跟“白、凉、红、香、碎、烂、光……”等性质形容词在分布上的相似性(经常作谓语或补语)把它们归为一类。当然,也可以基于其他考虑把它们分为两类(详见§7)。
§3 词类知识的来源
上文多次提到:单纯利用一两项分布特征作为分类标准可能会把属于同一类的词分成不同的类,而把属于不同类的词划作同一类。这样说多少意味着语言学家是心目中先有了这样那样的类,然后再去寻找分类标准的。那么在找到分类标准之前,语言学家的词类知识是从哪里来的呢?与此相似,普通人能正确地遣词造句,能够在不同的组合位置上正确地填上不同的聚合类的成员;这说明他们头脑中确有关于词类的内在知识,那么他们的词类知识又是从哪里来的呢?要回答这个问题,还得从词类的本质说起。因为词类是一种原型范畴,所以词类知识主要来源于人们对词和词之间在功能和意义上的家族相似性的概括。下面从两个方面来讨论这一问题。
第一,基于概念范畴的家族相似性。人们倾向于把表示相同、相似的概念范畴的词概括为一类,把它们填入相同的句法组合位置,即把它们当作同一个功能类去使用,从而赋予它们相同的句法功能。比如,人们把“苹果、梨、桃、橘子、香蕉……”等表示典型水果的词概括为一类,然后根据不同实体之间的家族相似性,把“椰子、甘蔗、荸荠、橄榄……”等表示非典型水果的词也概括进来,一样地填入名词这一类词所能占据的各种组合位置。推广开来,因为水果属于事物范畴,蔬菜、食品、衣服、车辆、家具、武器……等也属于事物范畴;所以人们会把表示蔬菜、食品、衣服、车辆、家具、武器……等概念的词填入表示水果的词所能填的各种分布位置,即把它们也当作名词来使用。当然,这样的类比使用带有尝试性,当基于类比的使用得到别人(社会)承认时,这种用法就会流行开来,成为这个/些词的正常分布;当这种用法得不到社会的承认时,说话人就得改正,退回来把这个/些词跟其他范畴的词类比使用。比如,“永远”本来是副词,它只能修饰谓词。但是,现在不少人把它当作“永恒”的同义词使用,加上“的”后去修饰名词,例如:“永远的朋友”、永远的友谊”、“永远的校园”等(11)。如果大家承认这些新用法是合格的,那么“永远”就在副词的功能之外又获得了区别词的功能,成为兼类词(参见§7)。可见,词义对词类的形成和识别具有十分重要的作用。但是,词的意义只是为该词可能有什么样的用法提供了可能,最终能不能被概括进某一词类,还得看它到底有哪些用法,占据了哪些分布位置。
第二,基于分布位置的家族相似性。概括、抽象是人类最基本的认知能力,人们会自觉地把分布位置十分相似的词归为一类,作为一个类来记忆和使用。这些分布十分相似的词成为某个词类范畴的典型成员,成为其他词能否归入该类的参照标准。在确立了典型成员之后,推广一步,把一些跟这些典型成员分布比较接近的词也吸收进来,概括为一类。比如,人们根据表示水果、蔬菜、食品、车辆、武器、衣服、家具等具体事物的词(具体名词)在分布上的相似生,把它们归为一类。然后发现表示观念、事件等抽象事物的名词(抽象名词)跟具体名词在分布上比较相似,就把这些词也概括进来,成为一个较大的类(一般名词)。随后,人们发现表示特定事物的名称的词(专有名词)跟一般名词在分布上比较接近,就推而广之,把它们也概括进来,形成一个大类(名词)。由于这种类的概括是建立在参照典型进行层层类比的基础之上的,因而同一类的成员在分布上只是在总体上大致相似,以至于很难找出一条为这一类的全体成员所共有而为其他类的成员所无的分布特征。
应当指出,普通人基于词的意义和分布的相似性而得到的词类的概念是极其模糊的,因为这种词类知识是建立在日常生活经验的基础之上的,而不是建立在严格的逻辑关系之上的。语言学家的任务就是要根据明确的标准、用严格的方法来划分词类,说明不同类别的词在语法功能上的差异(12)。所以,语言学家划分出来的词类跟一般人常识中的词类可能不同、甚至很不相同。但是,语言学家划分出来的词类不能从根本上否定一般人心目中的词类概念,即不能过分偏离说话人对于词类的语感。这跟生物学家对生物的分类工作不同,生物学家对生物的分类可以否定普通人常识中对生物的分类。比如,普通人认为鲸是鱼,所以称鲸为鲸鱼;但是生物学家根据鲸是哺乳动物这一特征,可以判定鲸不是鱼。而语言学家却不能这样做。比如,普通人认为“很”和“非常”是同一类词,都是表示程度的副词;但是如果语言学家根据“副词是只能充任状语的虚词”这一定义把“很”排除在副词这一类之外,这样做就很不妥当。因为普通人的词类概念来自于词跟词之间的分布相似性,并且普通人的词类概念又会直接影响词在言语中的具体使用。
§4 优势分布和劣势分布
上文指出用几项分布特征作为分类标准并不能真正地把词类划分清楚,那么应该怎样看待分布特征在词类划分中的作用呢?这就需要对特征的性质和类别有一个清楚的认识。事实上,特征至少可以分为定义性特征和特有特征两种(13)。定义性特征是某一范畴的成员所有、其他范畴的成员所无的特征。一个事物只要具备某个定义性特征,不管它还包含其他什么特征,这个事物就一定属于某一范畴。这种根据定义性特征概括出来的范畴就是特征范畴。显然,词类不是特征范畴,至少不是严格的特征范畴。特有特征是某一范畴的某些成员所具有的特征。由于某些特有的特征也很普遍、为某一范畴的许多成员所共同具有,因而在人们的印象中这些比较普遍的特有特征也被认为是某一范畴的特征。比如,会飞被看作是鸟的一个特征,尽管存在着这样的事实:蜜蜂、蜻蜒等昆虫也会飞,而企鹅、鸵鸟等鸟却不会飞。一个成员具有比较普遍的特有特征越多,它就越能成为某一范畴的典型。于是,比较普遍的特有特征成了识别原型范畴的标志。比如,尽管动词、形容词也能受数量词修饰,而部分名词却不受数量词修饰,但是能受数量词修饰仍不失为划定名词的重要标准。因为能受数量词修饰是名词比较普遍的分布特征,比较典型的名词都能受数量词修饰。因此,在划分词类时我们应该充分重视这种比较普遍的特有特征,不因某一比较普遍的会布特征不能贯彻到某一词类的全体成员而偏废。比如,我们不能因为“很、极”等极少数副词能做补语而否定只能做状语是副词最重要的分布特征;如果把副词定义为“基本上只能充任状语的虚词”,那么是十分贴切的。可见,凭几项分布特征之间的合取/析取关系虽然不一定能把同一词类的所有成员都包括进来,但往往能把某一词类的典型成员都包括进来,所以这种定义词类的方法仍有其不可替代的作用。
现在,经常用来定义词类的分布框架主要有三种:(1)成分功能,比如检验某类词能不能处于主谓结构中主语或谓语的位置,能不能处于述宾结构中宾语的位置,简称能不能作主语、谓语和宾语;(2)词类序列,比如检验某类词能不能受副词修饰、能不能受数量词修饰;(3)代表词格式,比如检验某类词能否受“很”或“不”修饰,能不能进入“~不~”格式等。在运用成分功能作为分布框架时,我们比较重视汉语词类的多功能现象——汉语词类跟句法成分之间不存在简单的一一对应的关系。比如名词除了可以做主、宾语外,还能做定语;动词除了做谓语外,还能做主、宾语。见图于下页首(14)。
但是,上述做法忽视了词类的多个功能之间的不平等性。所谓词类功能的不平等性是指某个词类虽然可以做多种句法成分,但是分布概率是不相等的。比如,名词主要做主、宾语,做定语不如做主、宾语常见;动词、形容词虽然可以做主、宾语,但在大多数情况下,动词主要处于谓语的位置,形容词主要处于谓语和修饰语(定语、状语和补语)的位置。反过来说,句法成分对词类也有一种优先关系,主、宾语主要由名词来担当,谓语主要由动词、形容词充任,补语主要由形容词来担任。这也就是说,词类的多个功能之间有优势分布和劣势分布之别,做谓语是动词、形容词的优势分布,做主、宾语是动词、形容词的劣势分布。词类的优势分布相当于人的第一职业,劣势分布相当于第二职业。显然,在日常生活中通常是按第一职业来确定人的身份的,同样,人们正是根据词的优势分布这种主要功能来聚类,从而形成关于词类的初步知识。因此,我们在给词分类时,也要充分注意到词的优势分布和劣势分布的差别,全面合理地利用成分功能这种描写框架。
§5 严格定义和宽泛定义
朱德熙说:“有的语法书上在说到名词的‘语法特点’的时候,举的是(1)能够做主语、宾语,(2)能够受定语修饰,(3)能够受数量词修饰之类。无论是(1)(2)还是(3),确实都是名词的语法功能,就是说都是名词的共性(所有的名词都有这些功能)。可是这三条里没有一条称得上是名词的语法特点(个性),因为这些功能,动词和形容词也有……要是用这三条作为划分名词的标准,那末通常认为是动词和形容词的那些词几乎全都得归到名词一类里去。”(15)如果导入优势分布和劣势分布的概念,把上面的(1)-(3)改写为:(1')经常做主语、宾语,(2')经常受定语修饰,(3')经常受数量词修饰;那么(1')-(3')就是对名词的语法特点的比较准确的刻画,它们十分符合人们对于名词的句法功能的语感。如果用(1')-(3')作为标准来给名词下定义,得到的就是名词的宽泛定义:名词是经常做主语和宾语、经常受数量词等形式的定语修饰的一类词。这个宽泛定义虽然比较模糊,但还是能把动词和形容词排除出去,因为动词和形容词并不经常做主语和宾语,也不经常受数量词等形式的定语的修饰。这种宽泛定义对于中小学的词类知识教学和对外汉语教学有一定的用处。
由于词类是一种原型范畴,某一词类的全体成员往往并不共有一条为其他词类的成员所无的分布特征,所以无法用几条特征之间的合取/析取关系来下严格定义,而只能下一种基于某类词的优势分布的带有概率性的宽泛定义。但是,这种宽泛定义太模糊,不能令人满意。好在各类词中的典型成员往往共有一些为其他词类的典型成员所无的分布特征,从而可以凭借典型成员所独具的分布特征来给词类下一种比较严格的定义。比如,典型的名词都可以受数量词修饰、但不受副词修饰。据此,可以给名词下这样一个比较严格的定义:以能受数量词修饰、但不受副词修饰的一批词为典型成员的一类词。同样,可以先给谓词下一个宽泛的定义:经常做谓语的一类词。再辅之以一个严格定义:谓词是以可用“不”否定的一批词为典型成员的一类词(16)。然后,给动词、形容词分别下宽泛定义:动词是经常做谓语或谓语中心、经常受副词修饰的一类词,形容词是经常做谓语和修饰语(定语、状语和补语)的一类词。再分别辅之以严格定义:动词是以能光杆带宾语或不受程度副词修饰的一批谓词为典型成员的一类词。形容词是以不能光杆带宾语和能受程度副词修饰的一批谓词为典型成员的一类词。在上述定义中,我们用能否光杆带宾语来区分及物动词和形容词,因为部分形容词也能有条件地带宾语(参见§1)。形容词带宾语的条件是必须带上“着”、“了”、“过”等时态成分构成复杂形式,如果去掉“着”、“了”、“过”,那么这种“形容词+名词”组合,要么只能理解为偏正结构,要么根本不合语法。例如:
歪着头~歪头 粗过脖子~粗脖子
黄了脸~黄脸 坏了事了~坏事
瞎了眼睛~?瞎眼睛
乱了队伍~*乱队伍
通过某一词类的典型成员来给整个词类下定义的方法既简便又直观,比较切近人们对于词类的语感。这种定义方式既反映了词类作为一种原型范畴的特点,又照顾到词类之间边界模糊的特点,无论对于教学语法还是专家语法,都有一定的参考价值。
§6 推广:语言学范畴的家族相似性
和词类范畴一样,语言学的许多范畴也是原型范畴,而不是真正的特征范畴。比如,句法结构是类型(type),属于同一种句法结构的许多实例(token)并不一定共有某种为其他句法结构的实例所无的特征,人们只是根据这些实例之间程度不同的相似性而把它们归入同一种句法结构的。比如,通常认为现代汉语的主谓结构具有两个特点:(1)主谓之间可以插入语气词“呢”、“吧”等,(2)主谓结构可以转换成反复问句的形式。例如:
价钱不贵~价钱吧不贵~价钱贵不贵
他爱游泳~他呢爱游泳~他爱不爱游泳
可是,有的主谓结构的主谓之间不能插入“吧”、“呢”等语气词,也不能变换成反复问句的形式(17)。例如:
家家都安了电话~*家家呢都安了电话~*家家安不安电话
什么活都干~*什么活吧都干~*什么活都干不干
相反,有的非主谓结构中间却可以插入语气词“吧”、“呢”等。例如:
因为吧我起床晚了一些,所以呢什么好吃的都没买着。
但是,上面提到的两条特点是主谓结构的典型成员都具备的,它们仍不失为评判某些实例到底是不是主谓结构的标准。比如,可以用这两条特点作标准来判定“今天种树”一类词组到底是主谓结构还是偏正结构(18):
A BC
他们种树今天种树马上种树
他们呢种树 今天呢种树 *马上呢种树
他们吧种树 今天吧种树 *马上吧种树
他们种不种树今天种不种树*马上种不种树
他们种树没有今天种树没有*马上种树没有
通过对比可以发现:B组非常接近A组,而跟C组差别较大。因而可以判定“今天种树”一类词组是主谓结构,而不是偏正结构。
下面,讨论一个稍微复杂一些的结构判定问题。刘勋宁指出:“看了三天了”的层次构造是“看了|三天了”,而不是“看了三天|了”(19)。理由有两条:(1)在“三天”前可以加上副词,例如:
D
看了都三天了
看了都快三天了
看了大概都快三天了
(2)“三天了”可以截取出来单独回答问题,例如:
看了几天了?——三天了。
我们同意这种切分方式,但更关心的是:“看了”和“三天了”这两个直接成分之间的结构关系是什么?首先,可以肯定“看了三天了”不是述宾结构。因为现代汉语中只有谓宾动词的宾语才可以受副词修饰,例如:
赞成马上出发建议分头行动
显然,“看”不是谓宾动词,但“三天了”之前却可以出现副词。值得注意的是这种副词还可以出现在动词之前,例如:
E
都看了三天了
都快看了三天了
大概都快看了三天了
也就是说,D组和E组有结构变换关系。通过调查,我们发现带状态补语的述补结构也有类似的变换关系。例如:
都热得出汗了 ~热得都出汗了
已经走得很远了~走得已经很远了
早就想得很透彻了 ~想得早就很透彻了
已经磨得很滑溜了 ~磨得已经很滑溜了
通过这种结构变换关系的相似性,我们可以比较稳妥地说“看了|三天了”一类词组是述补结构。可见,句法结构也是一种原型范畴,是人们根据不同实例在结构方式上的种种相似性而概括出来的类型。属于同一种结构类型的实例有典型和非典型之别。
句法结构有典型成员和非典型成员之分,相应地句法成分也有典型和非典型之分。就现代汉语的主谓结构和述宾结构而言,从语义上看,主语可以是施事、受事、与事、工具、时间、处所等语义格,宾语可以是受事、结果、施事、工具、终点、时间等语义格。但是,就绝大多数的句子来说,主语往往表示施事,宾语往往表示受事或结果。也就是说,典型的主语指施事,典型的宾语指受事或结果,其他语义格充当的主语和宾语属于非典型的主语和宾语。这样,我们可以把位置关系和施受关系结合起来,对主语、宾语问题有一个比较通达的看法:一方面承认谓词性成分前面的体词性成分是主语、谓词性成分后面的体词性成分是宾语,另一方面承认施事主语是典型的主语、受事宾语和结果宾语是典型的宾语(20)。比如,“我吃了”和“饭吃了”都是主谓结构、“杀了一条鱼”和“来了一个人”都是述宾结构,但是语感强烈地告诉我们:作为主语,“我”比“饭”更典型;作为宾语,“一条鱼”比“一个人”更典型。确定主语和宾语的典型性对说明汉语的词类功能有极大的便利,比如,凭着能否做典型的主语和宾语,可以把名词和时间词分开(详下节),凭着能否带典型的宾语可以把及物动词同不及物动词和形容词分开(详下节)。
原型范畴的理论对汉语方言分区工作也有一定的参考价值。比如,用一条同言线来划定方言区之间的界限的做法,实际上是假定方言是个特征范畴,同一方言区的不同方言点一定共有一项为其他邻近方言所不具备的语言特征。如果情况真是这样的话,只要锲而不舍地找到不同方言的这种独具的语言特征,就可以把汉语不同方言的界线划分得清清楚楚了。可是,实际情况比这复杂得多。在我们看来,方言在很大程度上也是原型范畴,是人们根据不同方言点之间在语音、词汇和语法等方面各种程度不同的相似性而概括出来的。比如,赵元任等《湖北方言调查报告》(21)把湖北省的方言分成四区,“第一区是一种西南官话”,但其中的四个点(一县一个调查点)“有几个北方官话的特点”;“第二区可以算典型的楚语”;“第三区的内部最不一致,几乎一处自成一派,……大体看起来是赣语系统的方言”;第四区的性质“介乎一、二区之间”。这充分反映出不同方言区在语言特点上的参差交叉的面貌。正因为这样,同一方言的不同方言点并不一定共有一项独具的语言特征。比如,保留古全浊声母、有入声调是吴语的特点,但湘语的不少方言点也保留了古全浊声母,官话的一些方言点也有入声。同一方言的许多方言点的地位并不相等,有的方言点是这一方言的典型成员,有的方言点是这一方言的非典型成员。比如,北方官话是官话的典型成员,而江淮官话和西南官话则是官话的非典型成员。不同方言的典型方言点之间的差别比较明显(如苏州话和北京话),不同方言的非典型方言点之间的差别就比较模糊(如江淮官话和吴语)。用原型范畴的眼光重新看待方言,将有助于汉语方言分区工作获得新的认识、发展新的分区方法。
§7 基于原型的词类系统
在原型理论的指导下,我们以九千多个常用词为主要对象(22),对现代汉语的词类进行了初步的考察,得出如下这个基于原型的词类系统。
从词和句法成分的关系的角度看,大多数词可以做主语、宾语、定语或谓语、补语、状语等句法成分,这种词可以叫实词。少数词不能做上述句法成分,这种词可以叫虚词。虚词里面又有两种情况,大多数虚词必须附着在其他词或词组的前后,组成一个词组后才能做句法成分或分句,比如介词、连词、助词、语气词都是这样的,这种词可以叫组合词。极少数虚词不能跟其他词组合,只能单独做句子里的独立成分,这种词可以叫独立词,独立词只有叹词一个成员。实词和虚词都是性质单一的词,它们或者能做句法成分(如实词)、或者不能做句法成分(如虚词),可以合称为单料词。此外,拟声词的语法功能很特别,它既能做定语、状语等句法成分,又能像叹词一样做独立成分,这种词可以叫双料词。上面我们把句法成分跟独立成分看成语法性质不同的单位,这有两方面的理由:第一,句法成分是构成一个词组的两个直接成分之一,比如主语是跟谓语相对待的,定语和状语是跟中心语相对待的,宾语和补语是跟述语相对待的;但独立成分没有相对待的直接成分,不能跟其他成分构成一个词组。第二,句法成分可以是词组平面上的成分,也可以是句子平面上的成分;而独立成分只能是句子平面上的成分,不可能是词组平面上的成分。这样,词在第一层次上可以分成单料词和双料词两类,在第二层次上单料词可以分成实词和虚词两类,在第三层次上虚词可以分成组合词和独立词两类。
实词能做句法成分,其中大多数实词能够单独成句,这种词可以叫自由词。少数实词不能独立成句,这种词可以叫粘着词。有的粘着词只能附着在其他词的前面,如数词、区别词和副词,可以叫前置词;有的粘着词只能附着在其他词的后面,如方位词和量词,可以叫后置词。自由词根据它们的优势分布又可以分为两类:一类经常做主语、宾语和定语,比如名词、时间词,可以叫体词;一类经常做谓语、补语或状语,比如动词、形容词和状态词,可以叫谓词。此外,代词也是自由词,它的语法功能很特点,它经常代替体词和谓词,行使体词和谓词做主语、宾语、定语或谓语、补语、状语的语法功能,但在分布上又受到一定的限制(详见下文)。为了跟代词相对待,体词和谓词可以合称为本词。这样,在第三层次上实词可以分为自由词和粘着词两类,在第四层次上自由词可以分为本词和代词两类,粘着词可以分为前置词和后置词两类,在第五层次上本词分为体词和谓词两类,相应地代词分为体词性代词和谓词性代词两类。上述讨论可以列成表见文末附表。
下面,简要地讨论一下这个词类系统中各类词的定义和分布特点。
1.名词 经常做典型的主语和宾语,一般不受副词修饰的词。
名词一般能做典型的主语(施事主语)和典型的宾语(受事宾语、结果宾语),还能做定语直接修饰名词。名词不能做状语和补语,只有一小部分名词可以做谓语,比如:
你傻子→你不是傻子
今天晴天→今天不是晴天
这种句子可以看作是省略了动词的紧缩形式。所以,至少可以说,名词是不能做典型的谓语的。
名词中有一部分词可以做“在/到/往”的宾语,它们是处所名词。除了“野处、远处、原地”等纯粹表示处所的词之外,处所名词还包括(1)地名,如:中国、北京、中关村……;(2)可以看作是地方的机构,如:学校、邮局、电影院……;(3)由方位词构成的合成词,如:上边、下面、里头……(23)。
2.时间词 经常做非典型的主语和宾语,不受“很、不”等副词修饰的词。
时间词做主语往往表示时间格,时间主语是非典型的主语,所以有的语法著作把它看作是状语,把“明天种树”一类词组处理为偏正结构。时间词经常做“在/到/等到”的宾语,表示目标格,属于非典型的宾语。时间词做定语是受限制的,其中心语一般必须是时间词和方位词(如:前天上午、立春前)。时间词不能做补语,只有一小部分时间词可以做谓语和受时间副词修饰(如:明天中秋、今天刚星期三);这种词在意义上往往表示一个时间序列中某一个确定的时点,如节目、节气、星期、月份等的名称。
3.动词 经常做谓语但不受程度副词修饰,或者受程度副词修饰后仍可以带宾语的词。
能带典型的宾语的动词是及物动词,其余的是不及物动词。动词可以受程度副词以外的副词修饰,而不及物动词不受“很”等程度副词修饰,及物动词中一部分可以受程度副词修饰,并且它们带了宾语后还能受程度副词修饰(比如,很爱孩子),这一点区别于形容词。
动词主要的语法功能是做谓语或谓语中心,还能做补语中心和非典型的主语和宾语。动词一般不做状语和定语,只有一部分双音动词可以做定语直接修饰名词,它们属于名动词(24)。
4.形容词 经常做谓语和补语,受程度副词修饰后不可带宾语的词。
形容词可以受各种副词修饰,一部分形容词带上后缀“着、了、过”后还能带非典型的宾语,但受程度副词修饰和带宾语两项功能不能同时实现,这一点不同于动词。比如,“爱国、吃亏、吃惊”能受“很”修饰,不能带宾语,所以是形容词;“冤枉”能受“很”修饰,又能带典型的宾语(如冤枉好人),但不能说“很冤枉好人”,可以处理成兼类词(兼属动词和形容词两类)。
形容词经常做补语和谓语(用在对举的格式中(25)),还能做非典型的主语和宾语。一部分形容词能直接修饰名词做定语(26),一部分形容词还可以做状语(27)。
5.状态词 经常做谓语、补语和状语,不受“很、不”等副词修饰的词。
状态词是由形容词通过附加、重叠等方式构成的,例如:冰凉、绿油油、小小儿的、干干净净。状态词只受时间副词修饰,不受其他副词修饰,区别于动词和形容词。
状态词经常做谓语、补语、状语(加“地”)和非典型的主语和宾语,状态词只有通过加助词“的”名词化以后才能做定语(28)。另外,动词和形容词大都可以带补语,而状态词是绝对不能带补语的。
6.代词 经常代替体词或谓词做主语、宾语、定语或谓语、补语、状语,但分布上受到一定限制的词。
说代词在分布上受限制,意思是代词不能占有本词(体词和谓词)的某些分布位置。比较重要的有:体词性代词一般不受定语修饰,谓词性代词不能做介词的宾语(谓词可以,比如:从哭到笑、从小到大、从煞白到通红)、不受数量词修饰(谓词可以)、一般不做补语(“怎么样”是例外)、不能带补语(这一点跟状态词相同)。
7.方位词 经常放在名词性成分后面的粘着词。
方位词常见的有:上、下、前、后、里、外、内、中、左、右、东、西、、南、北……。由这些单纯方位词加上前缀“以、之”构成的合成词(如:以上、之前)经常附着在名词性成分之后,属于合成方位词。由单纯方位词并列构成的合成词(如:东南、西北)和在单纯方位词后面加上后缀“边(儿)、面(儿)、头(儿)”构成的合成词,都属于处所名词。
单纯方位词还可以做“向/往/从”的宾语,还可以在对举的格式中做主语(如:上有政策、下有对策)。
8.量词 经常放在数词后面的粘着词。
9.数词 “一、二、三……十、百、千”等经常放在量词前边的词。
“一、二、三……十、百、千”和“半、两、多、几、多少”是单纯数词,“十一、几千、三百多”等是复合数词。数词基本上是粘着词,一般只能出现在量词前面。但“多少”和复合数词有时可以单独成句,如“多少?——一百二十”。
10.区别词 基本上只能做定语,只能出现在名词和助词“的”前面的粘着词。
区别词能够直接修饰名词,也能加上“的”构成“的”字结构后去修饰名词或做主语和宾语。区别词不受数量词修饰,不能做主语和宾语,区别于体词;区别词不受副词修饰,不能做谓语、补语、状语,区别于谓词。比如,“真正、永恒”不受副词修饰,只有加上“的”后才能修饰名词,属于区别词。其中,“真正”还可以做状语(如:真正解决),它兼属于区别词和副词两类。
11.副词 基本上只能做状语的词。
绝大多数副词是粘着词,只有“不、也许”能单独成句。绝大多数副词是前置词,它们只能做状语,只有“很、极”还可以做程度补语,属于不定位词。“透、透顶”只能做程度补语,因为跟“很、极”比较相似,所以也划入副词。因此,副词的严格定义是:只能做状语和/或程度补语的词。这个定义周延性好、典型性差,它掩盖了绝大多数副词只能做状语这一事实。
12.介词 只能在连谓结构和“的”字结构中带宾语的词。
介词跟它的宾语组成介词结构,介词结构可以做连谓结构的前段或后段,也可以是两个介词结构组成一个连谓结构(如:从东向西、由弱到强)。有的介词结构加上助词“的”转为体词性结构后可以做定语(如:对厂长的看法、关于办夜校的问题)。
介词跟动词的边界有不清楚的地方,如:“在、到、用、比”等词好像是兼属动词和介词。介词跟连词也有一些纠葛,比如“为了”是介词还是连词不易处理。
13.连词 只能连接词和词、词组和词组、句子和句子的词。
连词跟介词、副词都有一些边界不清的地方,比如:又……又……、既然……就……,这类格式中的“又”和“就”是连词还是副词不容易断定。
14.助词 只能用在区别词、体词和谓词性成分的前面或后面的虚词。
助词是一个很小的封闭类,常见的有:“的”(中型的、木头的、吃的)、“似的”(疯了似的)、“得”(跑得飞快)、“所”(所知道的)等。
15.语气词 经常用在主语和谓语后面的轻声词。
语气词是后置的粘着词,永远读轻声。语气词经常出现在主语和谓语的后面,还可以出现在其他可以有停顿的成分之间。例如:他吧,喜欢吃饺子|他还喜欢吃饺子呢|他啊,最喜欢啊,吃三鲜饺子|什么饺子啊,包子啊,炸糕啊,他都不爱吃|他们说啊,笑啊,闹啊,折腾了一宿|他就喜欢花啊,草啊,鸟啊,什么的。
16.叹词 不能跟其他词组合,只能单独作独立成分的词。
叹词不跟其他词发生句法关系,经常出现在句子的前面,有时也可插在句子的中间。比如:“唉,这日子怎么过?|这日子,唉,怎么过啊?”叹词没有固定的声调,总要跟语调配合起来使用,所以叹词的调型有时会超出阴平、阳平、上声、去声四种调型(29)。
17.拟声词 既能做独立成分,又能做句法成分的词。
拟声词可以像叹词一样做独立成分(如:叭,杯子碎了),还可以像谓词一样做定语(如:传来一阵叮当声)和状语(如:刺啦烫起一个泡|稀里哗啦蹚着水就走过去了)(30)。
上面的定义基本上可以作为各类词的分类标准。对于实词,定义尽量反映它们的成分功能(比如,能做什么句法成分、能带什么句法成分)和跟其他类词的选择关系(比如,能修饰什么词类、能受什么词类修饰);对于虚词,定义尽量反映它们的结构功能(比如,连词的连接功能)和分布位置(比如,能跟在什么成分或什么词类的前后)。这个词类系统是在调查九千多个常用词的基础上建立起来的,在更大的语料范围内能不能做到词有定类、类有定词则还需要作进一步的考察。
附表:现代汉语词类系统
注释:
① 维特根斯坦解释了这样一种有趣的现象:尽管下棋、打牌、赛球、奥林匹克比赛等活动都称为游戏(games),但是它们并没有一组共同的特征(比如比赛方式、决定胜负的方式……),它们之间只是存在着部分地重叠、交叉的相似性。就像同一家族的成员在体形、相貌、眼睛颜色、步态、气质等方面部分地重叠、交叉相似一样。这就是所谓的家族相似性(family resemblances)。参见L.Wittgenstein (1958) Philosophical Investigations,translated by G.E.M.Anscombe,Basil Blackwell.§ 66-67,p.31-32.
② 详见 E.Rosch & B.Lloyd(ed)(1978)Cognition and Categorization,Lawrence Erlbaum;J.Taylor(1989)Linguistic Categorization:Prototypes in Linguistic Theory,Charendon Press.
③ 朱德熙:《语法讲义》,商务印书馆1982年版,第55页。
④ 参考陈爱文《汉语词类研究和分类实验》,北京大学出版社1986年版第19页。
⑤⑥ 朱德熙:《语法讲义》,第41、192页。
⑦ 参考杨成凯《词类的划分原则和谓词“名物化”》,见《语法研究和探索》五,语文出版社1991年版第79页。
⑧ 参考邢福义《词类问题的思考》,见《语法研究和探索》五,第36页。
⑨ 关于两种范畴化理论,详见J.Taylor(1989)Linguistic Categorization:Prototypes in Linguistic Theory,p.2-4.中文介绍见廖秋忠《〈语言的范畴化:语言学理论中的典型〉评价》,见《国外语言学》1991年第4期第18页。
⑩ 参考朱曼殊等《心理语言学》,华东师范大学出版社1990年版第197-202页。
(11) 朱德熙先生认为“永远的”修饰名词是用“永远的”翻译英语eternal(永久的、永恒的)的结果,见朱先生1988年在第五次现代汉语语法学术讨论会上的讲话。
(12) 参考朱德熙《在中国语言和方言学术讨论会上的发言》,见《语法丛稿》,上海教育出版社1990年版第182页。
(13) 参考朱曼殊等《心理语言学》,华东师范大学出版社1990年版第197-202页。
(14) 详见朱德熙《语法答问》,商务印书馆1985年版第4-7页。
(15) 朱德熙:《语法答问》,第16页。
(16) 谓词中的状态形容词不受“不”的修饰。
(17) 参考陆俭明《周遍性主语句及其他》,见《中国语文》1986年第3期。
(18) 参考朱德熙《语法答问》,第33页。
(19) 参考刘勋宁《现代汉语词尾“了”的语法意义》,《中国语文》1988年第5期。
(20) 科姆里说:“典型的主语是施事和话题的重合,也就是说,从多种语言看,最明确的主语是同时也是话题的施事”。这种用原型而不用识别主语的充分和必要条件来表述句子成分的方法有相当的借鉴作用。参考伯纳德·科姆里(1989)《语言共性和语言类型》,沈家煊译,华夏出版社。
(21) 赵元任、丁声树、杨时逢、吴宗济、董同和:《湖北方言调查报告》,中央研究院历史语言所专刊18,上海商务印书馆1948年版,第1567-1570页。
(22) 我们主要考察了郑林曦等编的《普通话三千常用词表》(文字改革出版社1987年版)和《汉语水平词汇与汉字等级大纲》(北京语言学院出版社1992年版)中的八千八百多个词。
(23) 详见朱德熙《语法讲义》第42-43页,§4.2。
(24) 详见朱德熙《语法讲义》第73-74页,§5.16。
(25)(26)(27) 详见朱德熙《语法讲义》第104页,§7.7,第192-194页,§14.1和§14.2。
(28) 详见朱德熙1.《从方言和历史看状态形容词的名词化》,《方言》1993年第2期;2.《“的”字的方言比较研究》(未刊)。
(29) 详见胡明扬《北京话的语气助词和叹词》§3,见胡明扬《语言学论文选》,中国人民大学出版社1991年版第60页。
(30) 详见孟琮《北京话的拟声词》,见《语法研究和探索》1,北京大学出版社1983年版。
*本文承蒙业师陆俭明先生和学友郭锐先生指正多处,谨此致以诚挚的谢意。