“标准化汉字表”的编制与应用_规范汉字论文

“标准化汉字表”的编制与应用_规范汉字论文

谈《规范汉字表》的制定与应用,本文主要内容关键词为:汉字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

一、信息时代是汉字规范的必要性更加突显的时代

我国现代汉字规范工作酝酿于20世纪初期。新中国成立后,由于一些领导人的提倡,这项事业由学术层面转为国家行为,20世纪50年代以来的汉字规范政策,重要的是由国务院直接发布的,一般的或补充性质的,也是在国务院批转的情况下,由文化、教育、出版或语言文字主管部门单独或联合发布的。这些文件的发布和半个世纪的贯彻实践,为我国人民的语言文字生活注入了新的内容,形成了全国人民尤其是语言文字工作者牢不可破的规范意识和遵循规范的用字习惯,减少了各个领域使用汉字的难度,对文化、教育、出版和科技的发展,起到了无形的重要推动作用。试想一下,在幅员辽阔、人口众多的中国,政治经济如此统一的情况下,如果没有通用层面的汉字规范,仅仅是国家政令和基础教育这两项,书写不一的汉字将要带给人们多少麻烦,就可以知道“规范”二字具有多大的分量了!

1979年以来,国家改革开放,国情发生了巨大变化,中国正在实施的创新型国家的伟大战略中,信息化成为实现这一目标的重要支撑。有人说:“现在的文字已经很少手写,计算机的贮存空间又这样大,规范的必要性已经逐渐减退了。”这种想法只是从个人使用汉字的角度看问题,是不符合实际的。在信息时代,发展政治、经济、文化的重要条件,是及时和准确地获得必要的信息,并把需要传播出去的信息及时和准确地传播出去。计算机成为传播信息的工具,实现了信息传播的高速度、远距离和高度的社会化。由于信息的远距离传播,输出者与接受者是两头不见面的;在重大问题上,信息传播的两端已经不是一人对一人,而是一国对另一国、一个群体对另一个群体,信息的社会性得到了充分的体现。在这种情况下,汉字规范的作用就更加突显出来,可以说,有了汉字这种传播载体的标准化,才能实现信息传播的速度和信度。

二、必须增加规范汉字的字量

信息化时代汉字规范的一个突出特点是规范汉字的数量需要作一定的补充。从数量统计的角度,常用汉字和通用汉字的数量,不论在什么时代,都保持在3000~7000这个数量范围内。但是,完全从使用频率和语料覆盖率的角度来搜集用字,难以搜集到一些特殊领域的用字。这些特殊领域,在汉字主要是手写的时代,即使不立标准也不会有太大的问题,而在计算机和互联网时代,那些在一般语料库里凭借字频难以找到的字,在人民的日常生活中却不失其通用性:

科技用字。由于科学技术的发展和教育水平的提高,很多科学技术的用语快速进入人们的日常生活。仅仅拿记录化学元素符号的汉字来说,它们很多要用在药品名上,当药方不再手写而用计算机输录时,这些字就不断地出现在病人的手上。农药、化肥、室内装修材料也有不少是要用它们的学名来宣传、普及的。至于化妆品、清洁剂的使用,饮食健康的讲解,气象的采集和预报等等,一旦进入科学普及领域和基础教育的教科书,都会受到普遍关注。

地名用字。地名用字的使用范围往往不是全国所有地区通行的,但却属于当地居民的常用字,乡以上地名用字又是各省(市、区)不可缺少的。过去,由于民族和方言发音的分歧,经常会产生一些任意造的转语字(即当地人根据方音自造的形声字),造成用字的混乱。在户籍、邮政、信贷、金融等行业的信息贮存和检索已经数字化了的今天,地名用字的混乱会给有关行业带来哪些后果,是不言自明的。

姓氏人名用字。中国是一个多民族的国家,姓氏不但记录着民族和血缘关系,还成为每个公民的称谓符号。这些姓氏数量有限,但是必须正确使用,才能保证信息的信度。至于名字所用的汉字,现在已经相当混乱,有些名字的用字甚至在已经扩充到7万余字的国际编码中都难以找到,致使第二代身份证的制作由于姓名用字不全产生很大的困难。新的《规范汉字表》无法改变过去的那种姓名用字混乱的事实,但是可以学习一些先行国家的经验,对以后新生儿起名字作一些限定。这就需要尽量将姓氏用字收全,并在已有的人名用字中选择足够的、适合于起名字的汉字进行规范,以保证个人姓名在社会上的有效流通。

基础教育文言用字。规范汉字主要是书写现代汉语文本的,但是,传统与历史和现代不是绝缘的,现代文本中会引用文言作品,中小学语文教材中也都会收一部分优秀的文言作品。前者可以在一般的平衡语料库中收集到,而为了保证教材印刷的规范,需要在语文教材中专门收集文言文的用字。

以上四个方面,既然已经进入通用层面,为什么又不能在平衡语料库里依照字频和覆盖率收集到呢?这个问题需要从两个方面解释:第一,需要全面理解“通用”这个概念。通用包括两个侧面:一个是书写的侧面,一个是阅读的侧面。能够进入平衡语料库的汉字,兼有这两个方面的通行度;但是也有一些汉字,书写的频度并不高而阅读的频度却很高。例如,前面说到的西医药名、饮食营养学中的化学元素用字,有一些不在社会通用范围内,因为文本的使用率并不高;但阅读的几率却可以达到千家万户。又如,基础教育语文教材的文言用字,也有少部分不属于社会通用字,但是每年的教材印刷必须使用,历届老师、学生、家长必须面对,也是需要统一字形而进入规范的。第二,以汉字为载体的信息,一部分是在流通领域通行的,还有一部分是储备领域必需的。例如姓名,除了知名人士,一般的姓名在社会通用层面上使用度不会太高;地名,除了大城市、著名景点,一般的地名在社会通用层面上使用度也比较有限,根据字频和使用度不能将它们收集出来。但是,无所不往的邮政、金融、交通等事业,无人不用的身份证、户籍卡、学历证书、病历卡等证件,必须储备可能用到的汉字。如果在信息处理上不去对这些字进行规范,也会引起社会信息储备和使用的混乱。

《规范汉字表》所设的三级字表,又称准通用字表,就是从专门领域提供的专用字中收集的通行字,作为从语料库的字频和覆盖率、使用度中搜集的社会通用字的一种必不可少的补充。

三、分清“不规范字”与“未规范字”

《规范汉字表》是记录现代汉语的通用汉字字集,体现通用汉字在字量、字形等方面的规范。上世纪50年代以来陆续制定的规范字表,因指导思想不完全相同,研制手段有差别,针对的社会用字情况有不小变化,使这些规范缺乏内部的一致性以及对当下语言生活的适应性。因此,需要站在现代的历史高度,利用现代技术手段来考察当代用字的实际,对已有的规范进行梳理,消除其间相互抵牾之处,弥补因各种原因造成的疏漏,将一些隐性的规范显性化,增加现代语言生活的新内容,从而使已有的汉字规范得到整合、优化,为构建和谐的语言生活打下基础。

新的《规范汉字表》有很强的承袭性,为了覆盖过去的规范,原有的7000通用字只除去了极个别的严格异体字,其他全部照收,同时还增加了从科技用字、地名用字、姓名用字和基础教育文言文印刷用字中补充的准通用字。数量比过去增多了。但是,在社会通用层面上的通用字,并不能囊括每个人、每个领域、每个时间用字的全部,总是有些字不包括在《规范汉字表》中的。有些用字的专业部门担心自己所用的字不在《规范汉字表》内会妨碍将来的使用。这里,我们要明确“规范汉字”对应着的两个不同的概念:一个是“不规范的字”。已经有了规范汉字,在通用层面上书写现代汉语文本时,仍然去用对应它的严格异体字或繁体字,就属于不规范字。例如:我们认定“泪”为规范字,“浪”是它的严格异体字,不应当出现在现代汉语文本中。我们规定“险”“检”“剑”“俭”为规范字,一般不要在简化汉字文本里再出现“險”“檢”“劍”“儉”这样的繁体字。这样做,是为了减少冗余的字形,使通用层面上的用字统一起来。当然,如果写了错别字,就更是不规范的字了。另一个是“未规范字”,也就是没有被收入《规范汉字表》中、也不对应任何一个规范字的字。“未规范字”在需要使用的时候,是可以使用的。例如,《规范汉字表》说明,只是要求新生儿起名字时,限制用字表中的字,而字表发布前已经有的人名用字,如果不在字表中,只要不是错别字,仍然可以使用。因为这些字仅仅是没有进行规范,或有待于今后继续规范,是不能与“不规范字”同等看待的。

新的《规范汉字表》对规范的实施强度和适用的宽松度是有所中和的。也就是说,在有些地方,使用是宽松的。正确使用未规范字,在社会使用逐步趋同后再适应社会约定对这些字进行规范,这对专业领域用字,给了一定的方便。其他还有:第一,大规模的专业古籍文本,是可以采用繁体字印刷的;第二,新的《规范汉字表》,在三级字表(准通用字表)中,解放了一批异体字,并一一注明了它们允许使用的范围,其他异体字凡能认同为严格异体字的,在通用字范围内,不能使用来生成现代汉语文本,但是这批汉字在历史典籍中还有识读的价值,辞书中仍然要保留下来。为了对严格异体字进行认定,在新的规范发布后,有关单位会发表新的正异对照字表给使用者作参考。这些都是对规范使用范围的调整。

四、按照合理的规则调整印刷通用体的字形

国务院1986年批转国家语委《关于废止〈第二次汉字简化方案(草案)〉和纠正社会用字混乱现象的请示》的通知中指出,对汉字的简化应持谨慎态度,维护汉字系统的基本稳定。为了贯彻这个新时期中国文字工作的指导方针,新的规范吸收了历史上汉字规范的经验教训,并认真吸收了语言文字学家和相关专业人员的意见,在照顾社会性的同时,尽量不要偏离汉字自身发展的规律。

上面说过,新的《规范汉字表》对规范的实施强度和适用的宽松度是有所中和的。除了上面所说的处理宽松的情况外,也有进一步严格的地方,主要表现在对印刷字形的处理上:

新的《规范汉字表》在确定了字级与字量后,主要要规范印刷通用体的字形。首先是宋体字的字形。过去的《印刷通用汉字字形表》已经采取了有力的措施对规范字形的形体进行了统一,但是其中还有一些没有顾及到的地方。新的规范汉字需要从原有的规范中总结字形的笔画变异规则,并再次核查所收字,按照规则调整字形。这样做,首先是计算机处理汉字信息的需要,其次也是使印刷通用体字形的描述更加标准化。

字形调整需要遵循以下总原则:

1.尊重汉字结构。字形调整虽是笔形层面的问题,但笔形的变异也会影响汉字的结构;在规定笔形变异规则时,必须尊重汉字结构,不因笔形调整使字的结构模式发生错乱或因调整笔形产生同形字、易混字等。

2.考虑宋体风格。宋体字来源于雕版印刷字体,经过工艺美术处理,其笔形及笔画交接有自身的特点,总体风格讲求平直方正、对称均衡。新的《规范汉字表》的宋体字字形,应尽量符合宋体字的风格特点。

3.制定统一规则。调整字体,必须制定统一规则。一切规则是在条件的控制下确立的,为了减少随意性,条件相同的字应按统一规则处理,条件有变化时规则才能变化。印刷字形的美化属于工艺美术层面,也应考虑规则的一致性。

4.严格控制特例。在按规则处理字形时,会出现一些特殊情况,完全不允许特殊处理个别字是很难做到的;但在处理特例时应阐明充分的理由,尽量减少规则之外的特殊处理字形。

在总的原则控制下,宋体字的笔画变异需要有进一步的理性规定。这些规则是从原有印刷通用字形表中总结出来的,同时用来复查新的规范字是否符合这些规则。例如:

1.横变提。汉字宋体字形要遵循这样的基本规则,即:凡左侧偏旁最后一笔是横者,应变提。但是还要有以下补充规则:“丹、舟、女”为左侧偏旁时,由于横在中部,不变提。并应注意:(1)末笔为横的部件居中,且两边是对称部件,不符合“在左侧”的基本条件,末笔的横不变提,如“舆、辔”。(2)实际书写时不是末笔的横不变提,如“慧”。

2.竖变撇。基本规则是:“丰”“半”等作左侧偏旁时,竖变撇。如“邦”“判”等。

3.捺变点。基本规则是:一字有两个或两个以上捺笔时,其中一个变点。上下结构的字,上覆下者下部的捺变点,下承上时上部的捺变点。但是还要有补充规则:有几种情况可不变点:(1)辶、廴、走等作左侧偏旁、用最下一笔捺承托右侧偏旁,称作平捺。上面如果出现斜捺,而两捺之间有其他部件或笔画组相隔的,捺不变点。如“趁”“逶”等。(2)有三个捺的,只有中间一捺变点,其他不变,如“途”等。(3)品字型的三个捺,如“鑫”“森”“众”,下方左侧的捺改点,其他不变。(4)捺居中,且两边是对称部件者,不变点,如“瓣”“掰”等。

4.竖折勾变竖提。基本规则是:凡在左侧部件的竖折钩变竖提,如“巽”等。如有两个竖折钩且右面还有其他部件,两个竖折钩都变竖提,如“劗”等。个别例外:变竖提容易造成字形混淆者,可不改:如“创”左侧的“仓”竖折钩变竖提后与“饣”形近。

5.竖勾、横折勾去勾。基本规则是:(1)竖勾在底部都应去勾,如“条、茶、杀、亲”等。(2)“瞥”“勇”等上面的部件一律去钩。补充规则是:以下几种情况可不去钩:(1)“余”单用及作部件时都带勾。(2)为避免形近混同,“亦”不去钩。

除此以外,新的《规范汉字表》还对类推简化进行了严格的限制。

原有的《简化字总表》第二表规定了“可作简化偏旁用的简化字和简化偏旁”,共有132个简化字和14个不成字的偏旁,可以进行类推简化。在《现代汉语通用字表》范围内,类推简化.的原则已经贯彻,并出现了一些同形字和不合规律又没有依据的“人为新造字”,但因已经形成社会用字习惯,不能再改动。如果对《规范汉字表》中的三级字继续进行无限制的类推简化,必将产生为数不少的难以复原、难以辨认的人为新造字或同形字;但是如果三级字不进行类推简化,又无法与一、二级字保持字形上的一致。面临这种两难境地,《规范汉字表》的三级字实行“有限类推简化”,以保持汉字原有结构不变。其具体细则是:(1)按《简化字总表》第二表规定的132字与14个偏旁的范围类推,不扩大范围。《简化字总表》第一表的繁体字作构字部件时,无论是整体或局部一律不类推简化。如“讏”,不能简化为“(上)卫(下)言”,也不能把上面部件居中的“韋”简化为“韦”。(2)采用“部分代替全体”原则简化的字(如“亲”“产”“从”“丰”“广”“乡”“杀”“与”“云”等),以及结构产生变化的字(如“备”“荐”“双”“义”等),只在第一层次构字时类推,以保持原字的结构不受影响。(3)采用以上原则产生难以识别的怪异字或同形字时,为保持字与字的区别,宜作个别变通处理。不予类推简化。

在大型辞书中实行“无限类推”对查阅者是十分不利的,这不但会产生一些新的字形,使汉字的冗余形体增多,而且大型辞书的收字是备查的,改动了历史字形,使读者在阅读文献时遇到难字无法按原有字形查询该字,完全失去了辞书编纂的意义。所以,在《规范汉字表》发布后,根据国务院1986年指示的“今后对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定”的精神,表外字原则上不再类推,但前面已经说过,这些字仍可允许以历史原字形式使用。

五、防止对《规范汉字表》应用的简单化

《规范汉字表》规定了字级、字量和字形,但这是根据普遍社会应用层面来确定的,在教育、教学领域制定应用字表,既要遵循《规范汉字表》的规定,又不能简单截用其中的一段使用。这是因为,在一些专业领域里,会有一些其他规律在起作用。例如:在确定基础教育识字教学的分级字表或对外汉语分级字表时,如果简单地采用按照字频来分级,将会造成应用上的诸多问题。因为,教学要遵循循序渐进的原则,由易到难,而社会普遍应用层面的字频,与汉字的难易度和构形相互依存的系统是不一致的。我们可以比较以下三种语料库中不同的字频排列。下表是同一个字在不同语料库里的频序比较:

汉字 中 国发 年成种分体物

国家语委平衡语料 13 2129 334350527380

教育与科普综合语 9 2631 392437363818

料库频次(注:该语料库为《规范汉字表》制定人员综合合并而成。)

适合第一学段儿童132 156

103 223

119251

299

541

264

文学语料库频次(注:该语料库为北京师范大学儿童文学专家陈晖老师主持研制。)

从上表中我们可以看到,表中的9个字,在国家语委平衡语料库和科普与教育综合语料库中的频次,相去未远,都比较靠前,而在适合第一学段儿童文学语料库中的频次,要靠后得多。这是因为,6~8岁儿童的心理词典,与成人用词有较大的差距。事实说明,在制定课程标准时,分级字表不应当也不可能超越《规范汉字表》的一级(常用)字表,但是,简单按《规范汉字表》的频次来截取字段的办法是不可行的,正确的办法应当根据教学实际与儿童不同年龄段的心理特点,采用汉字必要的属性作参数,经过认真的科学研究,才能生成适用的应用字表。也就是说,在基础教育确定选字范围时,对《规范汉字表》的常用字表应当“不离不弃”,而在具体选字时,则应根据应用的特点慎重研究,“各取所需”。

标签:;  ;  ;  ;  

“标准化汉字表”的编制与应用_规范汉字论文
下载Doc文档

猜你喜欢