研制《规范汉字表》的设想,本文主要内容关键词为:汉字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
前言
新中国成立以来,国家语言文字主管部门陆续发布了一系列有关汉字的规范。由于这些规范发布时间不一,前后难免有矛盾之处;同时,从20世纪50年代到本世纪初,社会的语言文字使用状况发生了很大变化,某些规范已不能完全适应语言文字使用的实际需要。因此,近十多年来,语言文字学界、教育界、出版界、辞书界、信息界的许多专家和学者以及广大群众,都提出对原有语言文字规范进行必要的修订的建议,很多专家主张制订一个集原有各规范于一体的《规范汉字表》。
20世纪90年代以来,《规范汉字表》曾两次立项,并取得了初步成果。但都由于条件还不具备,所以没能达到预期的目标。2000年10月,随着《中华人民共和国通用语言文字法》公布,制订《规范汉字表》又被提上了议事日程。2001年初,研制《规范汉字表》作为国家语委“十五”重点科研项目正式立项。本文就是课题组对制订《规范汉字表》的初步探讨。
一 研制《规范汉字表》的总原则
在总结过去汉字规范工作的基础上,综合考虑海内外汉字使用的实际状况和需要,将研制《规范汉字表》的总原则概括为如下七条:
第一,《规范汉字表》不仅是一般社会用字的标准,也是计算机用字的标准。过去,社会用字标准的收字,仅限于一般社会用字的范围,不能完全适应汉字国际化和计算机信息处理的需要。《规范汉字表》如果能够覆盖社会用字与计算机用字标准,就可使上述问题得到解决。
第二,坚持科学精神,不回避问题。对于过去发布的各汉字规范中确属错误的、疏漏的以及相互矛盾之处,在保证社会用字稳定这个大前提下,必须努力纠正。
第三,力求稳定,尽量不出现或少出现新造字形。已发布的各汉字规范(特别是像《简化字总表》这样关乎用字全局的规范),虽然都或多或少地存在着不尽如人意之处,但从文字的社会性和“约定俗成”的原则出发,能不动的尽量不改动,以免造成社会用字新的混乱。从未出现过的新造字形,会给使用者带来不便,除非十分必要,一般不要出现。
第四,对汉字的形、音、义要综合考虑,《规范汉字表》应该是一个集字形、字音、字义、字序、字量规范于一体的综合性规范。过去发布的汉字规范,内容各有所侧重,使用者要遍查各个字表,才能正确使用汉字,而做到这一点是比较困难的。拟订中的《规范汉字表》集汉字的各种属性于一体,就能解决这个困难,其实用性将大大增强。
第五,尊重当前社会用字的实际状况,在调整中,适当考虑字源和字理。
第六,充分尊重语言文字学家、辞书专家、书法家、教师和其他汉字使用者的合理意见。
第七,兼顾海外汉字使用习惯,不扩大与海外使用汉字的地区、国家目前所用汉字的差异。
二 简繁问题
新中国成立以来,在汉字规范化方面所做的最重要的工作,就是推行简化汉字。简化字作为一种法定文字推行40多年来,已被大陆的群众普遍掌握。特别是20世纪50年代中期以后出生的几代人,从小学习、使用的就是简化字。海外也有很多人熟悉或使用简化字。当然,事物总有它的两面性,简化字也并非十全十美,它的不足之处,前人多有论述。这就是研制《规范汉字表》时所面对的简化字的总体状况。
既然简化字已经成为大陆人民和一些海外人士习惯使用的一种书写工具,就要尽可能保持它的稳定;而对那些明显的、影响文字功能的缺憾以及长期以来悬而未决的问题,应该力争在研制《规范汉字表》的过程中给予解决。
(一)类推简化的范围问题 1964年《简化字总表》的“说明”中指出:
第三表所收的是应用第二表的简化字和简化偏旁作为偏旁得出来的简化字。汉字总数很多,这个表不必尽列。例如有“车”旁的字,如果尽量地列,就可以列出一二百个,其中有许多是很生僻的字,不大用得到。现在为了适应一般的需要,第三表所列的简化字的范围,基本上以《新华字典》(1962年第三版,只收汉字八千个左右)为标准。未收入第三表的字,凡用第二表的简化字或简化偏旁作为偏旁的,一般应该同样简化。
这段话告诉我们,《总表》第三表是类推简化的示范,而不是给类推简化限定了范围。第三表未收的字,只要含有第二表所列的简化字或简化偏旁,“一般应该同样简化”。
但是,当一系列大中型字、词书相继问世,大型计算机字库相继建立,简体版的古籍纷纷出版时,类推简化中的矛盾就逐渐显露出来。例如:
1.字数大量增多。以含纟(糸)的字为例,《总表》第三表收了149字,而《汉语大字典》纟(糸)部字中除去“糸”处于下方的字(如“素”),有785字都是可以类推简化的。而且含纟(糸)的字还不只在纟(糸)部,如果把这部分字加上,数量就更多了。而被类推简化的大多数字,都是今天不再使用的。在辞书和字库中造出这么多不曾存在过的字形,是一种很大的浪费。
2.有些繁体字类推简化后,破坏了原字的结构,影响了字形的美观。例如1979年版《辞海》在处理“鸒”字时,就遇到这个问题。如果按“与(與)”的简化方式类推,那么鸒应简化作,字形既不美观,还变得不好认了。经请示文字主管部门,鸒和左右结构的都没有类推简化。
3.产生了一批同形字。如当油菜讲的“蕓”类推简化作“芸”,与“芸芸众生”的“芸”同形。
鉴于上述情况,我们倾向于对类推简化规定范围。但是,如果限定类推简化的范围,也会带来一些问题。如在同一出版物中就可能出现同一偏旁有时简化、有时不简化的情况,读者看起来会很别扭。因此,也有人建议采用灵活的处理方法,即工具书的类推范围可自定,出版物中可类推简化的繁体字一律简化。
此外,还有一种意见,认为类推范围群众不易掌握,不如无限类推。至于无限类推的问题究竟有多大,需要拿出一个确实的说法。这种意见不无道理,我们正组织专人摸底。
(二)同音代替问题 制订《汉字简化方案》时,存在着两种倾向。一是认为汉字不仅在形体上要简化,而且在数量上要精减,而后者更为重要。二是认为古今可以分开,汉字简化只管现在,不管古代。在这样的思想指导下,“同音代替”被当作一种重要的简化方式。《总表》一、二表的482组简化字中,同音代替的字组有100组,被简化的繁体字有106个(注:据《信息交换用汉字编码字符集·基本集》88、89区增收字计算。)。
但是,根据文字学的理论,一种文字系统符号的数量,必须保证记录语言的需要,保证使用者理解语言的最佳效果,而不是越少越好。同时,实践也证明,古今是不可能截然分开的,完全抛开古代汉语用字的需要去搞汉字的合并,难免会出现问题。这里试举几例:
例一,钟(鐘鍾)“鐘”与“鍾”是两种不同的古器物,都简化为“钟”,就分不清所指为何物了。此外,“鐘”与“鍾”又是两个不同的姓,混写为一个,也不合适。
例二,蒙(濛矇懞) 这里面有两个问题。第一,“濛”本义是细雨,“矇”本义是眼睛失明,“懞”指朴实敦厚,三字的意符本都有明确的表意作用,合并后三个字都失去了意符,表意作用也失去了。第二,“矇眬”是个常见的联绵词,形容两眼半开半闭、看东西模糊的样子。汉语的双音词特别是联绵词在书写形式上往往两字有相同的意符(与之义近的“朦胧”〔形容月光不明;模糊〕中的“朦”就保留了意符),所以,在书写形式上,“蒙眬”不如“矇眬”容易被人接受。
例三,云(雲) 由于云(雲)是可类推简化的字,所以原从“雲”的字都可类推简化为“云”。而在繁体字集中,有时同一偏旁下既有从“云”的字,也有从“雲”的字(如《汉语大字典》就同时存在芸—雲、沄—澐、枟—橒这三组字),当从简化字转为繁体字时,往往将简化字集中从“云”的字全部转化为从“雲”,结果就有一系列的问题可能发生:一是遗漏了繁体字集中从“云”的字,例如繁体字集《信息交换用汉字编码字符集·辅助集》中,就只收“蕓”而漏收了“芸”。二是错把原从“云”的字一律转为从“雲”,例如北京大学中文系冯仲芸教授的名字就曾被错写为冯仲蕓。三是会反推出一些从来不存在的从“雲”字。
对上述同音代替带来的弊端,我们初步设想,可以从如下三方面予以解决:
1.恢复个别繁体字。如钟(鐘鍾)一组,可考虑恢复“锺”字(金字旁类推简化),目前《信息交换用汉字编码字符集·基本集》已收入了“锺”字,《规范汉字表》可维持这一做法。
应注意的是:同音代替的简化字虽有若干弊端,但也已约定俗成,所以繁体字不可恢复得太多,影响面大的更要慎重考虑。例如干(乾幹)一组,尽管问题较多,但其义项大都常用,就不一定恢复“幹”与“乾”了,存在的问题可用其他方式解决。
2.在某些简化字下增加注释,指明简化字适用的范围(即在何种情况下应保留繁体)或注音。下列几种情况应考虑加注:
(1)某些同音字组合并简化后可能引起意义混淆的。 如前述干(乾幹)一组后原有注:“乾坤、乾隆的乾读qián(前), 不简化。”今可增:“包干的干读gān。”
(2)某些繁体字另有意义,不适合简化的。如苹(蘋)。蘋果的“蘋”是个晚起字,简化字“苹”是用改换简单声旁的方式造出来的新形声字(恰与古代当“艾蒿”讲的“苹”同形)。蘋果的“蘋”可简化为“苹”,但是“蘋”原来还读pín,指田字草,显然,“蘋(pín)”简作“苹”是不恰当的。因此,在苹(蘋)一组后应加注:“蘋(pín,田字草)不简作苹,类推简化作。”
(3)某些古汉语专用词和某些专名(姓氏、人名、地名等), 其用字不适于用同音代替字的。例如谷(穀),“穀”(粟)在古代有“善良”之义,如“不穀”,即不善之人,是古代王侯自称的谦词;“穀旦”,指良晨。如果写作“不谷”“谷旦”,就很难理解。又如后(後),“后”与“後”是两个不同的姓,都写成“后”就混淆了。再如征(徵),古人名魏徵、文徵明,若写作魏征、文征明,会使人感到是另一个人,且与古人起名的用意不符。上述这些词中的繁体字,应允许保留,并加注说明。
3.在一对多关系的简繁字组后,对简化字所对应的几个字的义项分配作出说明。这样可避免由简化字向繁体字转换时产生的错误。
上述这些不成系统的简化字经常作为简化字的缺点而被指责,但它们能否经过调整全部实现系统化呢?不可能。因为同一偏旁的字在整个文字系统中的地位是不同的,常用的字往往首先被简化,这些字和未被简化的字就会形成两个系统。事实上,汉字系统在其发展过程中,也处于不断的调整中。在简化字已经使用了40多年的今天,再回过头去调整已经形成的新的简化字系统,必然会造成新的不习惯。所以,在系统化的问题上,我们仍要坚持“力求稳定,尽量不出现或少出现新造字形”的总原则,能不动的尽量不动。不过,个别因疏漏而没有类推简化的偏旁,其简化形体已有群众基础,类推后也不会产生其他问题(如同形字),可予以考虑。比如瑙是否可依脑、恼简化为“”,巉、鑱是否可依搀、馋、谗简化为“、”。
最后,关于要不要吸收《第二次汉字简化方案(草案)》中的简化字问题,尽管其中有一些简化字是比较成功的(如橘简作桔,餐简作歺),但鉴于《二简》已于1986年由国务院批准作废,十几年来,为规范社会用字,“二简字”一直是被纠正的对象,并且纠正工作已取得很大成效,如果再吸收“二简字”,将会造成新的混乱,所以我们主张不在《规范汉字表》中恢复“二简字”。
三 正异问题
新中国成立初期,印刷物上一字多形的情况严重。文改会进行了异体字的整理工作。成果是1955年12月由文化部和文改会联合发布的《第一批异体字整理表》(以下简称《一异》)。
今天看来,这个字表问题较多。问题产生的原因很复杂,大致可归纳为如下几点:
(一)《一异》制订距今已有46年。这期间,我们国家发生了翻天覆地的变化,语言(特别是词汇)的变化是显而易见的,作为记录汉语词汇的汉字,也会有相应的变化。语言文字规范本来是应该及时修订的,拿半个世纪以前的规范来约束今天的文字使用,难免会有尴尬之处。
(二)后人没有完全理解当初制订字表的初衷,因而在宣传使用中发生了一些偏差。据当初参加汉字整理工作的老同志回忆,20世纪50年代整理异体字,主要是针对汉字字模混乱的情况。当时有些铸成的字模显然是错字,特意拿出来予以淘汰。时隔多年,后人对当时的情况已不甚了解,遂认为《一异》把字形搞错了。同时,《一异》所整理的只是当时所用的异体字,并非科学地、全面地从文字学上对最常见的异体字予以认定,所以就发生了被今人指责的“该收的没收,不该收的却收了”的情况。
(三)当然,也不能排除编制者的失误。这仍与当时只考虑现代用字的指导思想有关。虽然表前的《联合通知》中也有说明:“凡引古书须用原文原字的,可做例外。”但不易引起注意,在具体操作时,也很难掌握。
不管问题的产生是什么原因,问题既然存在,就应该解决。下面,我们提出调整选用字(即正字)规范的几点意见。
(一)针对《一异》收字比较庞杂的特点,对不同类别不同情况的异体字采取不同的处理方式 文字学上异体字的概念有狭义和广义两类。狭义的异体字是指音、义完全相同,只是形体不同的一组字,如“峰—峯”;广义的异体字除了包含狭义异体字之外,还包含那些部分音、义相同的字。如“雕”有两个意义:①一种凶猛的鸟。②雕刻。“雕”①又可写作“鵰”,“雕”②又可写作“彫”。像“雕—鵰”“雕—彫”这样的字可称作“条件异体字”。狭义异体字是需要规范的,而对条件异体字的处理,应作具体分析。《一异》对所有的异体字一律采用简单淘汰的处理方式,不加任何说明,这样处理无法区别全同异体字和条件异体字。制订《规范汉字表》,可针对正异意义关系的四种情况,采用不同的处理方式:
1.完全相同的,将异体字放在选用字后的括号内,不作说明。如:
2.选用字意义范围大于异体字的,在括号内的异体字前面标出相同部分的音项或义项号。例如“背”有两个读音:(一)bēi(二)bèi。当“背”读bēi,表示“用脊背驮”和“负担”的意义时,又可写作“揹”。它们的关系表示如下:背[(一)揹](一)bēi……(二)bèi……。
3.异体字的意义范围大于选用字的, 其相同部分的处理方式与第1类相同,即将异体字放在选用字后的括号内,异体字的特有意义另立字头。例如“资”和“貲”原本是两个意义不同的字。“资”指钱财,而“貲”的本义是罚缴财物,引申为计算货品的价格或数量,如“所费不貲”就是指所花的费用无法计算。由于古代“资”也通作“貲”,“貲”也有了“钱财”的意义,它们的关系可表示如下:资[貲]zī钱财。“貲”另见“赀(貲)”。
赀(貲)zī①罚缴财物。②计算。“貲”另见“资”。
4.意义交叉,即选用字和异体字既有相同的音和义,又各有不同的音和义。其相同部分及选用字意义大于异体字的部分处理方式同第2 类,即在括号内的异体字前标出相同部分的音项或义项号,异体字特有的音义则另立字头。例如“夹”有(一)jiā(二)jiá(三)g á三个音,当读jiá,表示“双层”的意义时,又可写作“袷”,但是“袷”今天又读qià,用于“袷袢”(维吾尔、塔吉克等民族穿的一种对襟长袍),这个意义是“夹”所不具备的;而“夹”(jiā)和“夹”(gā)的音义又是“袷”所不具备的。这样,“夹”和“袷”就形成了一种交叉关系。它们的关系可表示如下:
夹[(二)袷](一)jiā……(二)jiá……(三)gá……
袷qiā用于“袷袢”。另见“夹”。
(二)某些字组在《一异》制订时确有异体关系,但后来由于各种原因不再有异体关系了;还有个别字组原来就不是异体关系而被误收。上述这些字组应从《一异》中删去。
1.由于文字使用情况的变化,某些异体字组在今天已经失去异体关系。这些字组应不再看作异体字组。这里举一个典型的例子:
2.由于某些语言文字规范的制订,一些异体字组失去了异体关系。举一个典型的例子。
呆[騃] “呆”字有两个意义,一是愚痴,读dāi;二是死板,旧有dāi和ái二读,用于“呆板”。“騃”字,一读sì,指马行勇壮貌和急走貌,皆为古义;又读ái,指愚痴无知(“騃”并无dāi音)。“騃”和“呆”有共同的读音ái,意义基本相同,故《一异》将“騃”处理为“呆”的异体字。《一
(三)删除那些不必收入的异体字,补充一些原未收入而今天常见的异体字,对原来正异关系处理不当的字组进行调整 历史上出现过的异体字非常多,没有必要将它们都收入字表。《规范汉字表》只需列出那些现代常见的、有时还会用到的异体字就可以了。而《一异》所收的异体字比较庞杂,其中有不少现代不用的古字和很少见于印刷物的俗字、罕用字、草字,还有些异体字形经过几十年的规范,今天人们对它们已经很生疏,这些异体字都是可以删除的。此外,有些字组的正异关系也可以进行调整。以下分别举例说明。
四 新旧字形问题
所谓“新字形”就是“新印刷字形”,即上世纪50—60年代印刷字形整理时所规定的印刷字形。与此相对应,整理前的印刷字形就被称作“旧印刷字形”,简称“旧字形”。印刷字形整理工作是在通用汉字(当时选定了6196字)的范围内进行的,其成果体现在1965年由文化部和文改会联合发布的《印刷通用汉字字形表》中。该字表所规定的字形就是汉字印刷字体(宋体)的标准字形,即“新字形”的标准。到1988年,《字形表》作为一个通用字的字量标准被《现代汉语通用字表》取代,而在字形上,《通用字表》仍沿用了《字形表》所规定的标准。
与简化字和异体字不同的是,新字形的标准没有以一个《新旧字形对照表》的形式出现,而是隐含在《字形表》中。为了方便读者,各种辞书都依据《字形表》概括总结出《新旧字形对照表》,作为附录。但是,各对照表收入的形体虽大致相同,却又各有出入。语言文字主管部门对新旧字形的范围也没有作过统一的、明确的说明。这就给处理具体的文字问题时留下了隐患。下面,结合实践中遇到的一些问题,谈谈《规范汉字表》在处理新旧字形时的一些设想。
(一)划清新旧字形与繁简、正异三个概念的界限 上述三个概念的区别问题是在汉字整理的实践中产生的。在整理工作之初,并没有从理论上解决这个问题,而当异体字整理和汉字简化工作完成后,许多没有解决的字形问题都纳入了新旧字形的范畴。由于界限不明,三者的归类有时是不够合理的。解决实际问题,首先应从理论上对新旧、简繁、正异这三个概念予以界定。这里,试提出确定新旧字形的三个标准:
1.字形差别的细微性。新旧字形间的字形差别应只限于局部,一般表现为笔形的差异(如斜点与横点、竖点)、笔画相连与否(如艹与++)、某一笔画的有无(如吕与呂)及结构方式的微小差异(如感与)等。超出这种局限,就应该纳入简繁或正异的范畴。
2.普遍性。这里面有两层含义。一是有差别的形体存在于一系列的字形中,而非存在于个别的字形中。如“草字头”的字很多, 那么艹和++的差别可以类推到含有它的所有汉字中。凡新字形都从艹,凡旧字形都从++。如果一个形体的不同写法不带系统性、普遍性,那么这种不同的写法最好纳入简繁或正异的范畴。
3.固有性。整理印刷字形是在同一字的不同印刷(宋)体写法中选择一个,所以这些不同的写法应该是固有的,即两种或几种写法在过去的印刷物上都曾经出现过(可能都是宋体,也可能一种是楷体),而不应是人为杜撰出来的。
依据上述判断标准,我们认为某些原来当旧字形处理的字形,可处理为繁体字或异体字。
1.处理为简繁关系的新旧字形应同时符合以下三个条件:(1 )新字形为新造的,或在古籍中未出现或较少出现的。(2 )新字形笔画较少或较简的。(3)某一形体作为偏旁,出现在较多的字形中,其繁、简写法成系统的。
(二)新旧字形存在的范围 我们认为,谈新旧字形问题应仅限于繁体字和传承字。有人把新旧字形纳入到简化字中来,是不恰当的。异体字整理、汉字简化和印刷字形整理是一个系统工程,是整个汉字整理工作的三个步骤。我们不能把属于三个步骤间隙的、过渡状态的文字拿出来当作解说规范的对象。具体来说,从1956年开始分批推行简化字,其间使用的简化字确曾出现过旧字形的写法。但在1964年《简化字总表》问世前,简化字使用得还不多,而从1964年到1965年,带旧字形写法的简化字只存在了一年多时间,可以说是一种过渡状态的文字,没有什么实用价值,今后也不会有人再去写,所以今天在简化字集中,完全没有必要再搞出一套对应的旧字形来。
(三)繁体字采用何种字形的问题 我们认为,《规范汉字表》应确立规范的繁体字系统,而这一系统应以新的印刷字形为基础。过去,由于新旧、简繁、正异的概念纠缠不清,在繁体古籍中,出现了像“諍、誤”这样不伦不类的字形,背离了古代用字的实际。随着三个概念界限的划清,原来的新旧字形系统将得到梳理。凡是在古籍中不曾出现或较少出现的“新字形”,将被处理为简化字(争、奂、吴等),不再出现于繁体古籍中,而原来和它们对应的“旧字形”将被处理为繁体字,堂堂正正地出现于古籍。那时,背离古代用字实际的问题就会迎刃而解了。
(四)现有字形规范内部存在的字形不一致问题。
1.在《规范汉字表》的印刷字形设计上,要进一步提高标准化程度。在相同字形环境中,同一笔画、部件,在笔画形状、笔画组合和部件组合关系上应取得一致。以《现代汉语通用字表》为例,在字形方面就存在着一些问题,例如:餐—桊—褰(有的避重捺,有的不避)/颁—掰 蹩—鳖—弊—憋—瞥(有的笔画变形,有的不变)/辱—唇蜃—蓐薅褥溽(字形结构方式不一致)。
2.在《现代汉语通用字笔顺规范》(1997)中,从“廷”的字一律改成了从“廷”。目前, 多数人认为这一改动没有必要。 建议仍维持1988年公布的《现代汉语通用字表》的形体(廷)。
五 《规范汉字表》的字量问题
总的看来,在字量问题上有两种倾向性意见。一种意见着眼于日常应用,认为不必收得太多,规范主要是针对实际的应用,限制在8000—15000字的范围内即可。那些罕见的字没有必要去规范。 另一种意见认为应该覆盖已有的大型计算机字库。但持这种意见的人也并非认为多多益善,他们大都也认为应剔除无音义的字和确认是错误的字,同时作为国内使用的字表,要删去大部分日本、韩国、新加坡、越南等国所造的“汉字”。
课题组初步考虑,《字表》可分为四级(名称待商榷):
一级字 约3500字,略相当于原《现代汉语常用字表》。
二级字 约4500字,略相当于原《现代汉语通用字表》中除常用字以外的通用字。
三级字 约4000字,为除通用字以外的专业用字。包括地名、姓氏、人名、科技等专用字。
四级字 约18000字,罕用的古字、方言字等。
以上四级共计30000字左右,若加上对应的繁体、异体字, 总量约在45000—50000之间。
以上是我们《规范汉字表》课题组在研制字表的过程中,对一些问题的粗浅认识。发表出来,是为了抛砖引玉,以期引起学术界及广大群众对研制工作的关注,大家共同切磋、探讨疑难的问题,使《规范汉字表》真正成为一个科学的、符合当代用字实际的、便于使用的规范。