语言文字标准化与语言文字研究_语言学论文

语言文字标准化与语言文字研究_语言学论文

语言文字规范化与语言文字研究,本文主要内容关键词为:语言文字论文,化与论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

四十年前,1955年10月由中央教育部和中国文字改革委员会召开了全国文字改革会议,第二年1 月中国科学院召开了现代汉语规范问题学术会议。这两个时间、内容紧密相联的会议,是中国语言文字工作史上值得大书特书的大事,是我国文字改革和语言文字规范化工作进入一个新阶段的标志。当时,新中国才成立六年,百废待举,特别是即将开始实施第一个五年计划,就在这时开始进行汉字改革和现代汉语规范化的工作,正如陈毅副总理在文字改革会议开幕式上所说的,这是为了建设社会主义,而“在有几万万文盲的国家里,不可能建成社会主义,不可能有强大的工业建设”。当时任中国文字改革委员会委员的胡乔木同志在总结时也说,推广普通话和简化汉字,是适应广大群众需要的迫切任务,是加强汉民族政治、经济、文化统一的必要步骤。

四十年来,我国的文字改革和语言文字规范工作取得了巨大的成绩。推广普通话的工作日益广泛、深入,已经被载入《中华人民共和国宪法》,普通话已经成为全国各族人民之间和汉民族各个方言区之间通用的语言,在保证政令军令畅通、加强民族团结和国际交往、促进国家统一等方面,发挥了重要作用。汉字整理和简化工作的成绩也是十分显著的,精简了汉字的数量,简化了汉字的笔画,制订了汉字各项标准,基本上实现了现代汉语用字的规范,并且得到联合国和国际社会的承认。简化字和各项规范标准四十年来在扫除文盲(不要忘记,当时全国文盲率高达80%)、普及教育、发展科学文化事业等方面起了巨大作用。制订和推广《汉语拼音方案》是当时语言文字三大任务之一。《汉语拼音方案》从1958年全国人代会批准至今,在帮助识字、推广普通话、各种检索工作和中文信息处理等方面,以及不便使用或不能使用汉字的领域(如盲文、手语、旗语等)发挥了极为重要的作用,并已成为拼写中国人名地名和汉语的国际标准。

总览四十年来我国的语文生活,可以说,简化和规范汉字、推广普通话和《汉语拼音方案》这三件事,在各个层面上对国家建设、社会发展的各个领域一直起着有形的和无形的作用,其功绩就包含在国家的各项成就之中。如果我们的视线再向前移,从百年来文字改革历史的背景上观察和思考,就不能不赞叹这三项工作的历史性功绩。

从中国共产党第十一届三中全会以来,我国进入了以经济建设为中心的新的历史时期。十几年来,我国的语言文字规范化标准化工作一直处于这样的矛盾之中:一方面,现代化建设和对外开放需要语言文字更高水平的规范化标准化;另一方面,市场经济中某种程度的非统一性却使一些人产生一种误解,以为语言文字的规范化和标准化是没有必要的,字想怎么写就可以怎么写,普通话不必学,似乎地区经济发达也使得该地方言变得优越了。表现为社会现象,就是人们明显感到的繁体字回潮、乱写错别字、方言泛滥,与之对立的则是知识界对语言文字混乱状况的强烈不满和政府对语言文字管理工作力度的加大。

显然,那些妨碍和破坏规范化的观念和行为是违背语言文字发展演变的规律的。语言文字的社会性决定了规范化的必然趋势。秦始皇的“书同文”政策,正是一个庞大的帝国顺应这一规律所应进行的规范行为;由于当时的小农经济还没有多少超越居住地的人际交流,而秦与六国之间的语音差别也还不是很大,所以那时无需也不可能提出“语同音”的要求。社会的工业化要求全国的统一市场和全民性的义务教育,这就必然需要政府干预社会的语言和文字行为,把规范化趋势由个体的自发变为群体的自觉,使之加快。这是世界上各工业国家所走过的共同道路。我国在五十年代虽然工业化程度极低,但是党和政府意识到即将到来的工业建设高潮对语言文字的要求,所以适时地大力进行了语言文字规范工作。现在我们所面对的,是科学技术的高速发展、信息的急剧增长和处理、储存、传输手段的计算机化,这一形势对语言文字规范化、标准化的程度和速度提出了比以往任何时期都要高得多的要求;同时,国内各个地区之间、国内外之间交流频率的迅猛增加(例如技术和商品的交流,人员流动;各国学汉语的人增加等),现代通讯手段(例如电话和传真)的普及,尤其是计算机进入寻常百姓家,也促进了语言文字的规范化、标准化进程,虽然这是自发的、分散的。这是从现在起到下个世纪我国语言文字规范化、标准化工作与五十年代的最大区别。今后,我们只有紧紧抓住科学技术特别是中文信息处理技术的需求,才能高效、高标准地推进语言文字的规范化、标准化。

语言规划(语言文字政策),必须建立在充分的科学研究基础上才可以减少盲目性,提高预见性。从宏观方面说,语言文字有其自身的演变规律,规范化、标准化工作只能遵循这一规律,因势利导,做促进的工作,而不能按照主观想象和愿望进行。因此通过基础研究,把握语言文字演变的总规律,是制订语言文字政策的必备条件。从微观方面说,对普通话和众多方言的语音、词汇、语法规律,对不断涌现的新词新语和术语的规律,对汉字在社会生活各个方面使用的情况,也必须有准确深入的了解,才能保证政策的顺利实施。

四十年前确定简化汉字、推广普通话、制订和推行《汉语拼音方案》三项任务时,就是在近百年来志士仁人不断摸索、研究、实验的基础上进行的总结和提高。《汉字简化方案》和《汉语拼音方案》的制订、对“普通话”的界定,无不包含着丰富的科学研究的成果。

在过去的四十年里,研究工作时紧时松,时作时辍,特别是汉语规范化的理论研究,相当薄弱;而就继续完成这三项任务而言,也还有不少问题需要进一步研究。例如:

已经公布推行的简化字,有没有需要改进的地方?如何改进?按照文字自身的演变规律和文字与社会发展的关系,今后还要不要继续简化汉字?哪些字还应该并可以简化,哪些字无需或不能简化?此外,要不要规定社会用字量?例如人名、地名、技术术语用字要不要限制和规范?

过去的规范工作,基本上局限于汉字,至于语言的规范,只有对普通话的审音工作成绩比较显著。这方面需要研究的问题还很多。例如,普通话“以北京语音为标准音,以北方话为基础方言,以典范的现代白话文著作为语法规范。”其中“以北方话为基础方言”实际是指普通话的词汇主要取自北方话,但是“北方”如何划界?其词汇详情如何?哪些词汇属于“普通话”,哪些应排除在外?普通话的词汇量要不要适当加以限制?“典范的现代白话文著作”如何确定?其语法规则全貌研究清楚了没有?

《汉语拼音方案》还有没有可改进的地方?例如双字声母和韵母到底怎样表示为好?现在的声调表示法不便于书写和排印,怎样改进?与国际通用字母不合的ü和其拼写变形u,怎样处理?汉族人名、 中国地名的拼写法,少数民族人名和一些地名的转写法,怎样规范?……

如果说,这些问题是五六十年代留给当代学者的,那么,在我们对这些问题进行研究时,就不能依然站在三四十年前的出发点,而应该把这些年来社会与学术的发展考虑在内。

和三十年前相比,语言文字的规范化、标准化工作的社会环境已经发生了巨大变化。其中至关重要的变化有:

1,改变了国家封闭、地区间交流少的状况。 随着经济的发展国内形成了人口大流动;港澳即将回归和海峡两岸交流,使大陆的语言文字规范和大陆之外最重要的汉语汉字区域之间相互影响、相互制约的力量加大;对外开放使汉语汉字有更多的机会走出国门。

2,语言文字的载体和传输手段和工具有了很大改变。四十年前, 除口语外,汉语汉字主要是靠笔和纸记录,最多是由机械处理(打字、排版印刷、铸字等),现在则越来越多地依靠中文信息处理。中文信息处理技术不断取得进展,计算机在快速向社会生活的各个领域普及的同时,功能也在以惊人的速度向更高层次发展。

3,语言学自身的变化。近年来, 大量引进吸收了西方语言学(特别是计算语言学和数理语言学)的许多理论和方法,新的语言文字材料不断出现,在语言学许多领域取得了长足进步。

在这三大变化中,中文信息处理技术的发展对语言规范化工作的影响最大。因为中文信息处理与我国的经济发展、文化建设,特别是高科技的进步关系极大;信息处理对语言文字的规范化、标准化的要求远比一般社会用语用字严格得多,复杂得多。当前,中文信息处理在解决了汉字输入、存储、输出的难题之后,就急需确定击键输入编码、字形、字库、词库等标准和规范,在加快朝着更高层次,即以语句为单位的信息处理努力时,就要解决词处理、句处理以及语音输入、输出等技术问题,同时也需要相应的标准出台。而在这当中,任何一项技术难关的突破以及与之相应的标准的制订,都需要语言学研究成果的支撑。

传统的语言研究的目的,主要是要解决“人—人”之间的交流(包括超时空的交流——对书面语言的理解);在方法上,主要是定性研究,注意普遍性规则,忽视特例,重描写而轻形式。这种研究当然是需要的,今后也还要加强。中文信息处理所需要的,是针对“人—机”间的“交流”,要对一定量的语言事实作穷尽性定量研究;既要通例(普遍性规则),也要对特例(不合规则的事实,哪怕是一见)作出规则性的说明;对语言事实无论怎样描写,最后总要把所得出的规则模式化(可计算的语言模型)。

我国的中文信息处理技术是当前重要的计算机应用技术。现在,以大规模真实文本的自然语言为对象、以语句为单位、以智能化为目标的信息处理研究是中文信息处理向解决人与人、人与机器相互通信目标前进的关键,而这一研究的基础就是对汉语词法(包括区分词素、词、短语)、句法和语义、语用规律的认识。只有语言学提供了足够的规则和分析,才能建立计算机的“知识库”。离开了语言学的支撑环境,高一级的信息处理系统就根本无法建成。从十多年前开始至今,我国在解决字词一级处理方面已经取得了很大进展,而在语句和更大的单位处理阶段这些年来却进展缓慢,究其原因,主要是语言学研究没有为信息处理准备好基础。

语言学研究与信息处理严重脱节的主要原因有以下几点:其一,计算机技术发展迅猛,而语言学由于国家的长期封闭,知识的传承内容长期停留在面对教学的范围内,也就是只注意为人的理解服务。再加上在我们的大学教育中,文、理、工之间“壁垒”太严,研究语言者的“先天”知识欠缺,知识更新步履维艰,因此语言学跟不上计算机发展的速度,与中文信息处理技术之间隔膜甚大实属必然。其二,长期以来,流行于语法学界的理论和方法,基本上都是引进吸收的基于印欧语的理论和方法,用于汉语处理所需要的描写和处理常常不能“合榫”。改革开放以来,语言学界对西方语言学从介绍到消化,再到创新,已经有了可观的收获,但距离实际应用还有相当长的路。其三,十多年来,尽管上上下下都在号召或呼吁重视学科之间的交叉、渗透,支持新兴、边缘学科,但是成效甚微,在语言学的个别领域甚至还有分工越来越细、界限越来越明的趋向。

目前语言学(尤其是计算机最急需的语义学)可供计算机利用的成果还不多,这已经成了我国中文信息处理事业的“瓶颈”。正是由于这个原故,所以科技界,特别是信息处理界,改变了当年不大关心语言文字研究的状况,不但时时关注着语言文字研究的进展,甚至有人从头学起,亲自进行研究。这也从一个侧面反映了当前语言学制约中文信息处理技术发展的现实。

近年语言文字的研究(特别是对现代汉语和现行汉字的研究)有些已经朝着计算机的需要迈进了,虽然研究者可能只是从方法的改进着眼而并没有预想着为中文信息处理服务。例如,语法学界普遍认识到,在分析句子时,应重视从语法、语义、语用三个层面上进行。这正是中文信息处理为揭示自然语言的潜在意义、掌握自然语言的联想推理而正在探索的方向。再如,在句法研究中,突破了成分分析和以“话题”为主、对句子进行二分的习惯,运用了层次描述法,把谓词当作句子结构的核心,注意到谓词对语义结构类型的决定性作用和句子结构的分层向核性,其分析的结果与计算机所要认读的句法信息(包括格、价、时、体、量等)已经开始接近。又如,有人已经在尝试建立现代汉语句型系统,所用的无论是演绎法还是归纳法,其成果对建成全面覆盖汉语语句的规则库都是很有意义的。在语义研究方面,虽然可以称道的成绩比其他方面要少得多,但是从西方借鉴来的义素分析法和语义场理论已经被许多人所接受,并对少数词语进行了实际分析,对归纳汉语语义系统并使之形式化的问题开始有所涉及。如果继续完善这些理论和方法,使之更加适合汉语的实际,那么,对下一步建立汉语的概念体系、对词语进行属性描写,将有很大的指导意义。所有这些,都属于中文信息处理所需要的基础理论研究,只有基础理论建设得扎实了,才能把一些应用课题(例如词类划分规范、词性标注、句型规则库、机器翻译系统、人机接口等)解决得比较顺利。

但是,类似上述的语言研究,还需要作很大的努力才能与信息处理工作“接轨”。这是因为,这些研究还停留在理论构想、举例说明的阶段。这些理论还要在更大的语言范围,比如在几百万以至几千万字的语料中进行检验、修订、完善,最终形成计算机所需要的成果;而像词语意义的分析,则应该对相当数量的词语逐个进行描写、标注,以供输入计算机,再由计算机在更大范围里自动或半自动地获得所需要的全部语言知识。当然,要对这么多语言材料进行处理,靠传统研究手段几乎是无法完成的,必须使用计算机。因此语言学与计算机的结合,可能将是这样的过程:

理论——实践(1)——归纳——实践(2)——完善——实用

其中实践(1)一般是人工操作,实践(2)就应该是由计算机处理。这样,在计算机得到所需要的语言学研究成果的同时,语言学的理论和方法也逐步得到完善。所以中文信息专家们说:“一种语言学理论,只有为更多的人所共享,通过各种实现算法的验证,才能得以发展。”(袁琦、陈力为《九十年代中文信息处理技术的基本任务》,载《语文建设》1992,1期)。似乎可以说, 语言学在新时期要更好地为语言文字的规范化、标准化服务,就必须与计算机技术结合;而一旦实现了这种结合,不但对中文信息处理是极大的推动,而且可能将引发语言研究的一场革命,语言学也将因此而成为先行科学。

当前需要立即做的,是改变语言学和计算机技术相互脱节的状况,使双方沟通起来。语言学界应该随时了解中文信息处理技术进展的情况,计算机界应不断向语言学界提出需要解决的语言文字问题的单子,通报利用语言学成果的效果;在有些方面,更应该两方面联合攻关。“隔行如隔山”这条古训在二十一世纪前夕应该加上新的注脚了:必须打通这座山。

在信息化时代,语言学和语言信息处理技术以及二者结合的水平,已经成为衡量一个国家现代化程度的重要标志之一。世界科技发展的速度和我国经济发展的形势要求语言学尽快地承担起为语言文字规范和中文信息处理事业服务的重任。留给我们的时间已经不多了,整个语言学界都应该有这种危机感和紧迫感。

标签:;  ;  ;  ;  ;  

语言文字标准化与语言文字研究_语言学论文
下载Doc文档

猜你喜欢