现代汉字成分探析[*]_汉字演变论文

现代汉字部件探究[*],本文主要内容关键词为:汉字论文,部件论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

提要 修改现代汉字部件的定义,让单笔部件取得合法地位;建议“现代汉字部件表”包括“基础部件表”和“复合部件表”两部分,以更加广泛地适应计算机界和语文界的需要;提出“按等切分”的具体规则,以此来强化切分方法的可操作性。

部件是现代汉字学研究讨论的一个热点,但至今没能得出一个大家都能接受的研究成果,没有形成一个国家标准或部颁标准。原因是多方面的:现代汉字字形经过长期的演变,其构字部件已经不像早期汉字那样完整、那样明确,这给切分带来了困难,此其一;对什么是现代汉字部件的理解不一样,随之,确定的切分原则和拟定的切分方法也不完全一样,此其二;对切分的结果要求不一样,此其三。识字教学、汉字检索、字形整理和计算机汉字处理都呼唤现代汉字部件的规范化。有关现代汉字部件的研究讨论还将继续深入下去。我们十分高兴地得知,制订现代汉字部件的部颁标准或国家标准这项工作已经起步。我们希望这项工作从一开始就站在语言文字学界和计算机界已经取得的研究成果的基础之上,希望制订标准的研究工作能够集思广益、精益求精,使标准尽可能科学一些、实用一些。我们愿意把一孔之见提出来,供广大读者和研制部件规范的课题组参考。

汉字部件客观存在。东汉许慎推断:“仓颉之初作书,盖依类象形,故谓之文,其后形声相益,即谓之字。”(《说文解字叙》)清代段玉裁概括为:“独体曰文,合体曰字。”(《说文解字注》)许、段二位所说的能“合”成“字”的“文”,就是汉字部件的基础和核心。据文字学家研究,我们目前能看到的最早的成批汉字——甲骨文,至少有149个部件,〔1〕小篆至少有416个部件。〔2〕汉字进入隶楷阶段以后,字形虽然发生了较大变化,但合“文”成“字”的基础没有变。部件依然客观地存在在现代汉字的字形之中。

现代汉字部件的研究工作一直没有停止过。有的称为“字根”,有的称为“字元”,有的称为“字素”,有的称为“形位”。仅以中华人民共和国成立以后的研究工作为例,1965—1966年,由于识字教学的需要,在《文字改革》杂志上曾经集中进行了“规定汉字偏旁部件名称的讨论”。〔3〕后来,在教育界发展成为颇有影响的部件识字法。 从70年代末、80年代初开始,出于计算机处理汉字的需要,对汉字部件的切分问题进行了大量研究。经过反复讨论和实践,问题的焦点越来越明确,意见的分歧越来越清楚,讨论正在深入。

现代汉字的字形可以分为三个层次:笔画—部件—整字(有的称为“全字”,有的称为“成字”)。这个见解已经被学术界接受。正是在这一学术见解的基础上,有的研究工作者很自然地得出了一个关于部件的定义:“部件是构成合体字的最小笔画结构单位,其下限必须大于基本笔画,上限小于复合偏旁。”〔4〕

这个定义带来的最大麻烦是单笔部件的切分问题。

“旦”“艺”,因为字中的“一”“乙”可以独立成字,虽然它们不符合“必须大于基本笔画”的条件,但作为特例,可以切分,允许“一”“乙”取得部件的资格。而“引”右边的“竖”、“乒”下边的“撇”、“乓”下边的“点”、“幻”右边的“横折钩”、“买”上边的“横钩”、“乱”右边的“竖弯钩”却都不能切分,因为它们不符合定义“其下限必须大于基本笔画”的规定。于是“引”“旧”“乒”“乓”“幻”“买”“乱”“礼”“乳”“轧”“孔”“扎”“札”“乩”……均被定为部件,这些字都成了由一个部件构成的“独体字”。这样一来,既增多了部件的数量,在识字心理上也使一般人接受不了。

再者,“氕”“钆”等字,从造字角度看,其中的撇和竖弯钩都是声旁(“钆”读gá,“轧”省声), 在字中占有“半壁江山”的地位。连形声字的声旁都不能作为部件切分开来,实在说不过去。

面对汉字现实中的这些问题,北京大学中文系教授苏培成合理地把处于分离状态的横(如“鱼”“马”)、竖(如“旧”“引”)、撇(如“胤”“氕”)、折(如“乩”“幻”)都定为部件。这是一个突破。

但问题并没有完全解决。分离(指在现代汉字字形中有分隔沟的)确实是现代汉字切分部件时十分重要而又易于掌握的直观的字形标准,但联系历史和现状,发现在字形上有分隔沟的不一定是两个部件,如“以”

可见,现代汉字字形中的分隔沟并非都是古已有之的,并非都是部件的天然标志。又如“旦”字和“韭”字,从构字理据来讲,下面的一横都指地面,为什么仅仅因为“旦”的字形是从太阳与地面分离的古字形楷化而来,横就有资格成为部件,而“韭”的一横与原像韭菜形的部件相连,横就失去了充当部件的资格呢?再如简化字“币”,从造字法的角度看,它跟“氕”是一样的,撇在字中也充当声旁(简化方法是用简易声旁撇代替复杂声旁“敝”)。如果“氕”能切分为“气”“丿”两个部件的话,为什么“币”就不能切分为“丿”“巾”两个部件呢?把许多字一类比,发现光以字形有无分隔沟为标准,还是摆不平。

因此,我们主张再前进一步,把所有跟别的部件相接的笔画,凡是符合切分条件的也切分出来(详见第4节),作为基础部件, 如“币、千”中的撇,“主、太”中的点,“灭、歹”中的横,等等。确定定义是为了合理地切分部件,进行符合现代汉字字形实际情况的部件切分是为了便于学习和使用汉字。我们不能反过来,让部件切分工作来迁就自己界定的定义,从而给学习和使用汉字带来诸多不便。联系到《新华字典》《现代汉语词典》把横、竖、撇、点等都列为部首的做法,我们主张,从现代汉字字形的实际出发,把在字形中占有相对独立地位的单一笔画也定为可以切分的部件,不妨称之为“单笔部件”。在这方面,上海师范大学陶小东做了大量的分析研究工作。我们跟她的区别在于,她把“笔画”引进了构字这个范围,认为“乱”“引”等字是由部件(“舌”“弓”)加笔画(“”“丨”)构成的;我们则把“笔画”控制在构造字形这个活动之前,认为笔画只是构字的备用单位和书写汉字的单位。只要它一进入构字活动,符合我们拟定的原则和条件,就可以成为部件,就像它一进入查字法领域便成为部首一样。它跟其他部件的差别仅在于是单笔部件。

确立单笔部件的合法地位,其好处至少有四:1.符合现代汉字字形的实际情况。古代汉字的线条演变为现代汉字的笔画这一过程中,本来相连的线条被分割开了,本来分离的线条被连起来了。离和连,在很多情况下已经无法说清字源上的构形理据。今天,我们把“旦”中的一横和“血”中的一撇切分出来作为一个部件,主要不是考虑它们在古代汉字中曾经分别代表地平线和血点子,而是根据现代汉字的字形和我们对现代汉字部件的理解。2.减少了现代汉字部件的数量。“虬”切分为“虫”和“”、“旧”切分为“丨”和“日”、“朱”切分为“丿”和“未”、“主”切分为“丶”和“王”、“韭”切分为“非”和“一”后,都可以分别归并入其他已有的部件。3.方便了部件的切分。单一笔画能否成为部件,向来是争论的热点;相接部分如何切分,历来是研究的难点。众多研究者在它们面前踌躇再三,举“刀”不定。采用我们的原则和方法,都可以较好地解决,并减少了识字、写字的困难。如“番”的上半部分,既难分析,又难称说,还很容易错写为“采”。切分为“丿”和“米”两个部件以后,就变为容易分析、容易称说、容易书写正确。4.也符合一般老百姓的析字习惯,易于为常人所接受。比如人们常把“朱”称为“撇‘未’朱”;把“禾”称为“禾木旁”;称说“玉”字的时候说“‘王’字加一点”;称说“乏”字的时候说“‘之’字上面加一撇”。总之,让单笔部件堂而皇之地进入部件定义允许的范围之内,这是语文学界和计算机界很多研究工作者的共同想法。苏培成、陈爱文、顾小凤、潘德孚、张天光、陶小东等先生都提出过大同小异的见解。有人可能担心,单一的笔画也可以成为部件了,相接的关系也可以切分了,这样一来,会不会把整字都切分成笔画了呢?不会的,我们在第四节讨论切分的原则和方法时会提出加以控制的条件。

根据以上分析,我们建议把部件定义改为:“部件是现代汉字字形中具有独立组字能力的构字单位,它大于或等于笔画,小于或等于整字。”什么情况下等于笔画,什么情况下等于整字,由切分部件的原则和方法来规定。

单笔部件取得合法地位以后,计算机处理汉字时,在有的场合,可能更方便了,但识字教学会感到细碎。这是计算机界和语文界在切分部件的原则上、方法上有不同认识,对切分结果有不同要求的具体表现。总起来看,计算机界可能受汉字传统字理的影响较小,又受到电脑键位数的限制,往往把汉字部件切分得比较细碎,形体较小、数量较少。语文界则往往较多地照顾到汉字传统的构形理据,追求所切部件的相对完整性和块状化。他们切出的部件,形体较大、数量较多。如何把二者合理地统一起来?我们提出的解决办法是把部件分为两类:“基础部件”和“复合部件”,把部件表分为两部分:“基础部件表”和“复合部件表”,以此来扩大部件表的覆盖面,提高它的适用度。使用者可以根据自己的需要从部件表中“点菜”,组合成本领域适用的“部件表”。比如电脑处理汉字时,要求部件的数目尽量少些,切分的层次允许多些,那就可以较多地采用“基础部件表”中的部件;识字教学要求切分的层次少些,部件的块状结构相对完整一些,就可以较多地采用“复合部件表”中的部件。这几年在语言学界很得人心的“柔性规范”的提法,似乎在部件规范上也有用武之地。

在这里顺便要提到现代汉字字形的三对术语。考虑到现代汉字字形结构的实际和切分出的基础部件比较细小这些情况,我们提议不采用传统汉字学主要根据古代汉字的形体提出的、在人们心目中早就有固定理解的“独体字”和“合体字”这两个术语。把这两个术语留给传统汉字学使用,而在现代汉字学中改用“单部件字”和“多部件字”这两个术语,从而减免了很多现代汉字字形难于确定是“独体字”还是“合体字”的困难。这样,我们就在现代汉字学字形的三个层次上分别选用了三对术语:在笔画这个层次,把笔画分为“基本笔画”(如:一丨丿丶)和“复合笔画”(如:フㄑㄣ);在部件这个层次,把部件分为“基础部件”(如:“丶”“又”“丿”“戈”)和“复合部件”(如“叉”“戊”);在整字这个层次,把整字分为“单部件字”(如“串”“川”“及”“丰”)和“多部件字”(如“患”“圳”“圾”“慧”)。列表如下:

下面讨论切分现代汉字部件的原则和方法。

1.根据和原则:

在现代汉字中,记号字和半记号字已经占有相当大的比例。1985年北京大学中文系教授裘锡圭指出:“由于种种原因,在我们现在使用的汉字里,原来的意符和音符有很多已经变成了记号。相应地,很多表意字、形声字和假借字,也就变成了记号字或半记号字。”〔5〕1982 年中国文字改革委员会委员胡乔木指出:“要尽可能使汉字成为一种拼形的汉字。这对于尽快实现汉字的信息化,将是一个重要的进步。 ”〔6〕汉字字形的这一实际情况给了我们这样的可能性:即不必拘泥于汉字传统的偏旁概念,在进行部件切分这个环节上,我们无法因而也不必刻意去追求每一个零部件跟字音字义的历史联系,从而可以主要从现代汉字字形这个角度出发,去追求合理合用的部件切分。我们认识到现代汉字的部件,在字形上跟甲骨文、小篆的部件仍有历史渊源,但由于字形上的混同、分化、讹变,很多部件在形体上已经不可能跟古代汉字的部件一一对应。完全根据字源来切分部件,做不到;只对少量汉字根据字源来切分部件,既使标准不统一,又给不掌握字源的切分者造成困难。我们认为,切分现代汉字部件主要应从现代汉字字形的实际出发,只能以现代汉字的规范字形为主要依据。好在现代汉字中字源是形声字、会意字的占绝大多数,这些字中的大部分,在字形上仍保持形旁、声旁的相对独立性。主要根据现代汉字字形来切分部件,对多数字来说,不会跟构字理据完全相悖。切分部件时,要努力达到“三性”——合理性(主要指合于现代汉字字形之理)、一贯性(把原则和方法贯彻到底,进行穷尽性的切分。当然不排斥少量特例)、可操作性(尽可能减少切分的任意性)。

2.方法:

(1)构字笔画之间有相交关系的一律不切, 如“夷”“秉”“史”“柬”等。有相离和相接关系的则都具备切分的可能条件。全包围结构要切分,只限于框内部件跟边框是相离关系的,如“国”“叉”等。

(2)除了可能条件以外,相离和相接的部分要切分开, 还必须具备必要条件,即切分出来的每一个部分在现代汉字中都具有独立的组字能力。如:“沐”切出的“氵”和“木”都能跟别的部件组成另一个字;“自”切出的“丿”和“目”也都能跟别的部件组成另一个字。

(3)除了“一”“乙”之外, 其他笔画也具有被切分为单笔部件的资格,如“白”中的“丿”、“乓”中的“丶”、“韭”中的“一”等,只要它符合我们规定的控制条件。

(4)为了防止把字形全部切分到笔画这一弊病, 从三方面加以控制:一是切分出单笔部件后的剩余部分必须具备独立的构字能力。如:“乒”切出“丿”后,所剩的“丘”可组成“兵”“邱”“岳”等,可以切分;“匆”切出“丿”后,所剩的笔画组合在现代汉字中不具备构字能力,因而不切。二是每一层次以切分出一个单笔部件为限。如“亍”,只能切分为“一”“丁”或“二”“”,不能切分为横、横、竖钩。三是每个字切分出的部件中,必须有两笔或两笔以上的部件(笔画数为一笔、两笔的字除外)。

(5)为了避免切出很多过渡性的无用的复合部件, 不强求每一层次都用两分的方法。如“疑”的左旁和右旁都是没有组字能力的过渡性复合部件,就可以采用平面切分法,一次切分成四个部件:“匕”“矢”“マ”“疋”;“豆”也可以采用平面切分法,一次切成三个部件:“一”“口”;“画”也可以一次切成三个部件:“一”“田”“凵”。

(6)为了降低切分的任意性,提高切分的可操作性, 我们提出“按等切分”的规则,即把切分的结果分等。切分时遇到两可甚至“三可”的情况时,就逐等扫描,按先优后劣的原则选定切口。如“元”,可以切成“一”“兀”,也可以切成“二”“儿”。因“二”“儿”都是常用成字部件,这种切法我们列为一等;而“一”“兀”中,“一”是常用成字部件,“兀”是罕用成字部件,这种切法我们列为二等,所以,把“元”切成“二”“儿”。“并”,可以切成“”“廾”,也可以切成“”“开”。“”“廾”是两个常用不成字部件,属六等;而“”“开”一为常用不成字部件,一为成字部件,属五等。根据先优后劣的原则,把“并”切成“”“开”。“亍”,如切成“二”(常用成字部件)“”(单笔部件),属四等;如切成“一”“丁”,都是常用成字部件,属一等。根据先优后劣的原则,切成“一”“丁”。

我们拟定的“按等切分”规则共分12等:

1)切出的都是常用成字部件,一等;

2)切出的是常用成字部件和罕用成字部件,二等;

3)切出的都是罕用成字部件,三等;

4)切出的是常用成字部件和单笔部件,四等;

5)切出的是成字部件和常用不成字部件,五等;

6)切出的都是常用不成字部件,六等;

7)切出的是成字部件和罕用不成字部件,七等;

8)切出的是罕用成字部件和单笔部件,八等;

9)切出的是常用不成字部件和罕用不成字部件,九等;

10)切出的都是罕用不成字部件,十等;

11)切出的是常用不成字部件和单笔部件,十一等;

12)切出的是罕用不成字部件和单笔部件,十二等。

在极少数场合,当采用“按等切分”的方法还不能实现唯一性时,就辅之以部件之间离合程度等条件,比如“章”,可以切分为“音”“十”,也可以切分为“立”“早”,切出的都是常用成字部件,属一等。这时就可以根据部件间的离合程度,取后一种切分方法。

由于我们坚持切分规则和方法的一贯性,我们把很多人认为毫无疑问不能再切分的部件“氵”“口”“木”等也分别切为“丶冫”“丨”“十八”等。有些专家对此表示接受不了。其实,我们在前面已经说明,我们所定的规则和方法是想同时适应多方面的要求。“丶冫丨十八”和“氵口木”都是部件,差别仅在前者称为“基础部件”,后者称为“复合部件”罢了。如果您对“氵”“口”“木”的再切分接受不了,而且您的研究和教学工作也不需要把它们再往细里切,那就请直接选用“复合部件表”中的“氵”“口”“木”,因为它们原本就收在我们拟定的“部件表”中。反之,如果您在研究工作中感到选用“氵”“口”“木”还不方便,希望切得更细一些,那就请在“基础部件表”中选择“丶冫丨十八”,因为它们也收在我们拟定的“部件表”中。“菜单”在您面前,“粗”“细”由君自定。

根据我们确定的定义、原则和方法拟定的“现代汉语3500常用字部件表”共有部件384个,其中:“基础部件”290个(含单笔部件8 个、多笔部件282个,其中成字部件即单部件字162个)、“常用复合部件”94个。(详见附表)“常用复合部件表”是开放的,可以根据实际需要增删。以识字教学为例,如教“湖”字,学生识字不多的时候,复合部件可以选“氵”“古”“月”;识字稍多,就可以直接选用“氵”“胡”。

附注:

〔1〕参见赵诚《甲骨文字学纲要》“附录一部首表”, 商务印书馆1993。由于甲骨文字形的特点,我们认为,所列部首绝大多数都可以视为不能再切分的部件。

〔2〕王宁等《〈说文解字〉计算机研究系统与各类属性的测查》,《中国古籍整理研究出版现代化国际会议论文集》,1995。王文称为“形位”,小篆有成字形位291个、非字形位125个,共计416个。

〔3〕参见费锦昌《关于规定偏旁部件名称问题的讨论》, 《语文现代化》丛刊1980年第1期。

〔4〕傅永和《汉字结构和构造成分的基础研究》, 陈原主编《现代汉语用字信息分析》117页,上海教育出版社,1993。

〔5〕裘锡圭《文字学概要》16页,商务印书馆,1985。

〔6〕《把文字改革的火焰继续燃烧下去》,《文字改革》1982 年第1期。

参考文献:

1.苏培成《现代汉字学纲要》,北京大学出版社,1994。

2.苏培成《现代汉字的部件切分》,《语言文字应用》1995 年第3期。

3.高家莺、范可育、 费锦昌《现代汉字学》, 高等教育出版社,1993。

4.傅永和《汉字结构和构造成分的基础研究》,收入《现代汉语用字信息分析》,上海教育出版社,1993。

5.晓东(陶小东)《也谈部件定义》,《语文建设》1993年第6期。

6.晓东《现代汉字独体与合体的再认识》,《语文建设》1994年第8期。

7.晓东《现代汉字部件分析的规范化》,《语言文字应用》1995年第3期。

8.张天光、黄伯荣、翟万林《汉字构成的字元分析法》,《语言文字应用》1995年第3期。

9.潘德孚、詹振权、潘骑《汉字部件简论》(打印本)。

附:现代汉语3500常用字部件表(共384个)

一、基础部件290个

1.单笔部件8个:

(基础部件中,成字部件即单部件字162 个:一乙二十厂七丁卜八人入匕几九儿刁刀力又乃了于丈弋才寸巾川丸及门也女子丰井韦夫专五车屯牙瓦比日曰中内见手毛长片爪氏勿丹乌为心尹巴以予书水戋甘世龙东北凸目且田由甲申电皿史央凹四乍斥瓜乎冉甩册匆乐永必司民弗出皮发母耳臣西吏而夷曳虫曲年臼舟农争亥州丞臣甫更两酉丽豕求里串我身局奂免其事雨妻非垂秉承革柬面禺重叟禹兼曹堇象庸鹿惠黑曾鼠熏)

二、常用复合部件94个:

氵忄宀丬广工土士大尢小口山彳夕夂尸己(已巳)弓幺纟马斗文方火户王木廿犬歹戈止攴贝父攵斤月欠风殳穴立疒衤示石业矢禾白鸟用矛疋衣羊米耒老页虍缶舌竹自血羽糸辛言麦走赤豆辰卤足谷采角青齿黾鱼音鬼麻

[*]本文是提交首届全国语言文字应用学术研讨会(1995.12北京)的论文。原题为《切分现代汉字部件的原则和方法》。发表时有删改。感谢王宁、苏培成、顾小凤等先生认真审读初稿并提出讨论意见。

标签:;  ;  ;  

现代汉字成分探析[*]_汉字演变论文
下载Doc文档

猜你喜欢