“泰晤士报”呼吁引进“汉语拼音信息处理标准”_电子计算机论文

“泰晤士报”呼吁引进“汉语拼音信息处理标准”_电子计算机论文

时代呼唤着“中文信息处理用拼音文字”国家标准的出台,本文主要内容关键词为:拼音文字论文,中文论文,国家标准论文,时代论文,信息论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

【摘要】 中国的信息产业面临21世纪信息化社会的严重挑战,也是一次机遇。中国目前电子计算机之所以不能在全社会普及,其中一个原因,是编码方案的繁难与识字文化背景脱节和不统一。现有的编码方案,没有一个是与语言文字的教育、学习、使用相结合的。因此亟须制订出“中文信息处理用拼音文字”的国家标准,才能突破中文信息处理的瓶颈。“中文信息处理用拼音文字”,只能是在《汉语拼音方案》加以完善的基础上进行研制,只能是“拼音文字”的直接输入转换成汉字输出,而不是音码代符的输入转换汉字的输出。之所以要以《汉语拼音方案》为基础,是因为它的应用已经渗透到文化、生产、生活的许多领域中去了,有广泛的社会基础和群众基础,而且在国际上也已被广泛应用,并成为联合国、国际标准化组织采用为国际标准。因此,以《汉语拼音方案》为基础制订“中文信息处理用拼音文字”国家标准,是最佳的选择和决策。

【关键词】 电子计算机 信息化社会 中文信息处理 拼音文字 汉语拼音方案 国家标准

西方产业革命之后,使用拼音文字的西方国家将拼音文字打字机制造出来,并普及到寻常百姓家,迄今已200余年了。然而今天,中文打字机以其设备笨重、成本高、效率低、操作难,只作为企事业机关办公室里专门职业的打字员的“专利品”而无法普及到寻常百姓家!就像中国的印刷出版界的排字房一样,宋体、仿宋体、1号、2号、3号、4号、5号、大1号、小1号……黑体,斜体……中国印刷用的铅字房,整整地占满好几间几十平方米的大房间而令人望而生畏不已。排字工人为检字、排版要在几间大房子里来回走动找出所需要的铅字来,一天来回所走的路程竟长达几十公里。成千上万的汉字,需按部首或笔画的次序排列着,排字工人需要学习和记忆这些汉字的部首分类和笔画以及安放的位置和排列的顺序,因此中国的印刷出版业为此付出了沉重的代价并失去了印刷机械化的机会!中文打字机是在西方拼音文字打字机问世近百年后才问世的。然而中文打字机也与中国的印刷出版界的情况相类似。中文打字机需要把成千上万个汉字按部首或笔画安排在一个大字盘上,或用一个较小的字盘放置常用、次常用字三千多个;用一个较大的字盘安放通用字和少量的特殊用字(如姓氏用字、生僻难字、专业用字、地名用字和古代罕用字等)六七千至一万个左右。中文打字机操作人员也需要进行专门的训练和学习、熟悉并记忆汉字的部首分类和笔画结构以及字盘上汉字排列的位置和次序。操作时先看文本(或文稿)再把视线移到打字机字盘上找到所需的汉字,然后再移到按键上进行击键,再将视线移到印纸上看看是否准确地打出了所需的汉字。无论从设备的简易和效率来说,中文打字机实在太落后了。所以西方拼音文字打字机已普及到寻常百姓家一百多年后的今天,中文打字机仍然无法普及到全社会的寻常百姓家中!原因就是设备复杂成本高,打字机售价昂贵,普通老百姓的经济能力承受不起;其次由于字盘无法小型化(微机化),一般老百姓住房面积狭小,没有地方安放这种笨重庞大的设备;最重要的原因是效率低,需要专门训练操作技能和记忆字盘的铅字排列位置和次序,老百姓写字比打字还快,不需要效率低下的中文打字机。由于中文打字机的落后,中国又一次失去了普及打字机械化的一个时代!

如今,即将跨入21世纪,中国又面临着信息化社会的挑战。我们要迎接挑战,抓住机遇,尽快制订出“中文信息处理用拼音文字”的国家标准,以促进电子计算机在全社会的普及应用。

在当代,国际上国家与国家或民族与民族间的竞争或较量,是经济实力的竞争与较量,就是高新技术的竞争与较量。说到底,是人才的竞争与较量!谁在人才方面占据了优势,也就占据了高新技术的优势,也就会在经济实力上占据优势!否则就会落在时代后面,就会被时代所淘汰,就会被动挨打,沦为帝国主义列强掠夺、剥削、欺凌的对象!因此,我们一定要迎接世纪的挑战,把自动化、信息化的高新技术搞上去,并且要占据优势,才能立于不败之地!使五千年的灿烂文化再度辉煌,再次对世界的文明发展作出贡献!

信息处理的方法大致有三种:由打字机键盘实现字符或代码输入计算机进行处理;直接图像(图表、形体)识别法输入计算机进行处理;直接自然语音识别法输入计算机进行处理。

图像识别输入法就是利用光电检测器和电子变换器对图象进行识别和转换,这需要有高度的精确性和复杂的尖端技术,相对来说设备成本高昂、技术难度大。因为输入的图像各式各样:数量多、形体复杂,对模式的识别自然难度大,但是已经有了点触式或书写式等输入法投入应用。不过图像识别法还没有被普遍采用。

语音识别输入法也由于几乎每一个人的发音不尽相同,设备的技术要求也自然很高很难,所以也没有被普遍采用。虽然已经有了很大的进展,语音输入已能识别几万个词语,但是人机直接对话还需加以提高和完善。因此语音识别输入法,也还没有被普遍应用,但它是计算机智能化的发展方向。

目前应用得最普遍的还是打字机键盘输入法。

1964年世界计算机产业的垄断巨头IBM公司说,要么消灭计算机,要么消灭汉字;断言汉字无法利用先进的电子计算机进行信息自动化的处理。

可是1972年,中国上海的一位工程师打破了IBM公司的武断神话,他创制了一套汉字输入电子计算机的方法。从此中文信息处理方案的研究与开发工作蓬蓬勃勃地展开了,一片兴旺发达的景象,令人欢欣鼓舞,新方法、新方案不断地涌现出来!

1978年在青岛召开了全国汉字编码学术会议,对汉字编码工作,从理论方法到原则、技术,以及具体的编码方案进行了热烈的探讨、交流和研究,真正做到了“百花齐放,百家争鸣”。时至今日,已申请专利的汉字编码方案有三四百种,已公开发表或已正式提出的方案有五六百种,合计汉字编码方案已达千余种。有人谑言说真是“千军万码”、“群雄割据”、“精英混战”。这种情况是喜?还是忧?

1986年召开了一次汉字编码方案的评估选优会议。虽然选出了“最优”或“最佳”方案十几种,但是时至今日仍然还没有哪一种方案占绝对优势,也没有哪一种方案普及到寻常百姓家庭中去。这很值得深思。有人对1986年的评估会议提出了尖锐的批评。第一,没有经济实力为后盾的编码方案无法参与竞争。因为想参评的方案必须缴纳相当可观的参评费。参评后能否评为“最优、最佳”方案仍是个未知数。即使评为“最优、最佳”方案,能否收到实际的经济效益的回报也是未知数。如果都落空了,显然在经济上是得不偿失。对于没有经济实力的人来说是不堪这种巨额的经济负担的。第二,评估的标准(即内容)与方案的社会实际应用并不完全吻合。比如片面追求重码率低、输入速度快等标准与内容,就不切合社会的实际应用。片面追求重码率低,必然增加编码规则的复杂性,也就增加操作的记忆负担。输入速度的快慢只是对专业操作员说的,与老百姓电脑操作无关。专业操作员是经过专门的职业训练的。速度的快慢除了与编码方案的输入法有关外,还与操作员的文化水平与个人技能素质有关,也与年龄有关(一般是十七八岁至二十三四岁的青年女操作员)。所以一分钟输入170—240个汉字的速度表面上比拼音文字输入字母的速度快(字母打字每分钟200—300个字母或字符),但这种速度与思维活动速度无关——即编码输入时,操作员只是机械地输入汉字编码,对文本(或文稿)内容不加思索,不加理解。而老百姓操作计算机,要求不需要记忆复杂的编码规则,喜欢那种不会忘记的简单容易操作的方案,一上机就能操作,使用那种直接与文字相一致的编码输入法或文字输入法。这样就可以一边思考一边盲打输入,速度并不需要太快,能跟上思维活动的速度即可。拼音文字字母输入每分钟200—300个字母或字符的速度已经可以了。另外,老百姓希望男女老少都能使用电脑,不能像专业电脑操作员那样,往往只限于十七八岁或者二十三四岁的年青姑娘。第三,目前上千种的编码方案最根本的缺陷就是,所有的编码方案没有哪一种直接同文字的学习、记认、使用相结合。而如果方案不与文化背景、知识背景及社会语言文字应用背景相一致——学字、识字、写字、用字、查字的知识背景相结合,就肯定无法推广到全社会老百姓家庭中去。事实证明了这一点。

自从1945年世界第一台电子计算机问世以来,从庞大、笨重复杂的电子管计算机到中型化、小型化的晶体管电子计算机,再到微型化的集成电路台式、袖珍式电子计算机,再到今天已发展到超大规模集成电路和超高速运算的电子计算机,计算机经历了好几个发展阶段。从功能上说,电子计算机从单纯的数字运算,发展到商业、金融、办公自动化等方面的应用,再到老百姓家庭日常生活事务等的应用。现在电子计算机从单纯的数字计算、图表、绘图制作等方面的应用发展到以语言文字为主要对象的全信息的处理和应用了,如今电子计算机的应用主要是语言文字的信息处理,占70%以上,数学运算及其他方面的应用占30%。电子计算机发展到今天,已到了人工智能化计算机的开发与应用阶段了,而我们中国却还在“千军万码”编码方案的“群雄割据”与“精英混战”中徘徊,在汉字输入计算机的大门口裹足不前!时间对于我们已经不多了,时间对我们太宝贵了。我们没有理由将巨大的人力、物力和智力消耗在上千种的编码方案的纸堆里!1986年评估会议之后立刻就有远见卓识的人士提出国家要拿出统一的、规范的、标准的方案来!“千军万码”的局面再也不应该继续下去了。

日本在60年代初也有过像今天中国计算机信息界“群雄割据”、“精英混战”的痛苦经历,使他们与世界计算机信息处理技术的发展滞后一二十年,丧失了占领世界计算机市场的宝贵时间和机会。因为日本的文字是假名夹用汉字的混合型文字(夹用的汉字有1945个)。他们开始的时候为了把汉字输入计算机,也产生过几百种的编码方案。由于没有统一的、规范的、标准的输入法,所以严重地阻碍了计算机的普及。使用计算机的只是金融机构及企业、事业机构及其他部门的办公室。而计算机的操作人员也必须经过专门的职业训练才能上机操作,计算机操作员成了一种专门行业的职业。到了70年代中期,日本计算机信息界先后推出了全假名拼音转换汉字输入法和日语罗马字全拼音输入法。从此,到了70年代末80年代初,各种各样的日文编码方案在资本主义市场经济的自由竞争中逐渐被无情地淘汰而退出历史舞台,计算机的使用很快就逐渐普及到全社会的家庭中去了。因为计算机操作再也不需要进行专门的职业训练,也不需要记忆繁难复杂的编码规则和操作技能,凡是上过学校学过日文的人,无论男女老幼都能很容易地上机操作,并且计算机的日文处理与日常日文的学习和应用相一致。而且计算机的功能除了文字处理自动化外,还有多种用途:如记帐、制图、绘画、数学运算、资料储存与检索、金融、商业、购物及信息咨询文字处理、教育学习、游戏娱乐等等。因此,老百姓乐于购买计算机,于是计算机很快就普及了,计算机产业迅速得到了发展,并很快迎头赶上了世界先进水平。现在日本的计算机产业正虎视眈眈地觊觎着老牌美国计算机产业的霸主地位。据报道,1995年全世界个人计算机(即微型计算机)销售量为5970万台,在日本销售量为571万台,中国为100万—110万台。中国人口12亿,比日本1亿1千多万人口多11倍,销售量却仅为日本的五分之一强,反差是十分明显的。更有甚者,发达国家全社会家庭计算机拥有量为20—35%,个别家庭甚至拥有几台或一人一台。中国全社会家庭拥有计算机量仅为0.5%(全社会拥有量总共约为240万台,个人拥有量0.5%,不过是十几万台而已)。

在中国个人计算机不能普及,必然严重在阻碍着计算机产业的规模生产与发展,也等于阻碍了计算机高新技术的发展。“群雄割据”与“精英混战”不但分散和浪费了人力和物力,更严重的是智力的浪费与扼杀,计算机产业不能集中人力财力进行深层次和高精尖的硬件、软件的开发与发展。中国的计算机硬件、软件多半只是“追踪”世界技术发展的水平,而不能领先于世界的先进水平,这就使中国计算机产业失去抢占世界计算机产业大舞台高新技术竞争的优势地位,始终处于劣势的境况,这对于国家和人民来说将是多么严峻的一种局面,就是说我们的国家和人民在国际的经济实力竞争与较量中处于劣势!

须知21世纪的国际竞争实质是人才的竞争,而人才的竞争又取决于高新技术人才的培养,人才的培养又有赖于教育的普及与提高,而教育的普及与提高很大程度上又赖于信息的获取、储存、传递、交流。比如说吧,今天的中国大学生,要向未实现电子计算机管理的学校图书馆借阅参考书或资料,他首先要到图书馆的存书目录卡片柜去查阅书目和存书号,这些目录或按部首排列,或按笔画排列,必须费很多时间查找书目,再填写索书条,然后交给图书馆管理员去书库找出来。再后从书中抽出登记卡来让借书人填写单位、姓名、借书证号,最后把借书证连同登记书卡一齐交给图书馆管理员,借书或资料的手续才全部办完。最快也得几十分钟,有时整个上午或下午的时间都浪费在查找目录和办理借阅的手续中去了。如果所索取的书或资料已被借出,则办上述一系列手续的时间算白白地浪费了。而发达国家的大学生宿舍里就配备有一台计算机终端,学生不出宿舍门就可以通过计算机终端查找所需借阅的图书或资料。找到书或资料后,可以检索全文或其中所需的章节、片段或提要。然后可以用自己的空软盘储存起来,也可以打印出来。如果学校的计算机终端与国内其他图书馆,甚或与世界各国的图书馆联网的话,那就不但可以查阅全国各图书馆的书目和资料,而且还可以查阅世界各国的图书馆的书目与资料了。如果说不是每个学校的学生宿舍都备有计算机终端的话,起码著名的大学的学校图书馆或省立、市立图书馆肯定是会有的。由此可见,信息的获取、储存、传递和交流对于人才的培养,对于教育的普及和提高是多么重要!

发达国家1993年提出了建设“信息高速公路”的战略,接着又提出建立“全球信息网络”的战略。中国的信息产业面临21世纪信息化社会的严重挑战,也是一次机遇。中国当然再也不能像失去印刷机械化时代、打字机械化时代那样再失去一个信息化时代!中国计算机产业要突破中文信息处理的瓶颈,就必须突破编码方案的“群雄割据”、“精英混战”的局面,否则将贻误赶上世界计算机产业发展的先进水平的宝贵时间和机会!

中国目前计算机之所以不能普及,除了计算机价格昂贵,一般家庭经济能力无法承受之外,还有一个原因就是全民的文化水平还亟需提高(虽然全国的文盲、半文盲的人口从两亿多减少到1亿多,但九年义务教育并未在全民中百分之百实现)。因为计算机毕竟是高层次的文化商品,一般文化水平低的家庭是不太需要用它的。

除此之外,还有一个重要的原因就是编码方案的繁难与识字文化背景脱节和不统一。买了甲家方案的电脑,乙家方案的电脑不能用。现在一般电脑都兼容好几种编码方案,(学习一种编码方案负担已经够沉重的了,谁还愿意同时学习几种编码方案呢?岂不自讨苦吃?所以兼容只不过让人从多种输入法中选择其中一种罢了),但是没有哪一种编码方案是与语言文字的教育、学习、使用相结合的。这样一来,就需要进行专门的训练和学习才能记住繁难复杂的编码规则与操作技能,如果不经常用它,很快就会忘记。所以计算机信息处理的编码必须同学字、认字、写字、用字相一致,这样计算机的使用与普及才有可能,否则就不可能实现普及。“日文全假名拼音转换汉字输入法”的历史经验证明了这一点。

中国法定的文字是方块汉字。由于汉字数量过于庞大:常用字2500,次常用1000;通用字7000;加上专业用字至少有1万2千到2万多字,字库的内存信息量太大了,在技术上虽然不是绝对不可能,也是非常复杂和困难的,成本也会十分昂贵。就目前计算机硬件来说,拼音文字有200兆就十分宽绰了。而我们中国,汉字采用压缩技术,计算机的硬件需要400兆!很明显,势必使得中文信息处理的计算机设备成本高,运算或处理信息的速度与效率降低。无论哪一种的汉字编码方案(音码——以汉字的读音进行编码或形码——以汉字的形体或字形进行编码)都无法与西方拼音文字的拼音直接文字输入相比——无论其设备的简易与成本或运算速度与效率,汉字编码比拼音文字直接输入要落后,这是计算机信息界都承认的事实,只有个别冒充所谓“专家学者”的门外汉才妄言“汉字输入计算机的速度比西方拼音文字快”、“中文信息处理已领先于世界先进水平”、“汉字唯一能够成为国际性通用的文字”、“有声调的汉字将是语音输入计算机唯一优越的文字”等等,这些伪科学的口号泛滥充斥于语言文字学界与中文信息处理学术界,干扰和阻碍了语言文字与信息处理正常的学术研究和科学讨论。必须对这些谬论加以批驳并予以澄清。同时也要呼吁信息处理学术界的专家学者们,和语言文字学界、工程技术界……放弃门户之见,放弃争名夺利的狭隘目光,从振兴国家民族的科学技术与经济实力的高度来考虑目前中国语言文字学、中文信息处理技术与计算机产业严重滞后的严重局面,紧急动员起来、组织起来,利用社会主义社会制度的优越性,集中人力物力进行“中文信息处理用拼音文字”国家标准的研究与制订工作,由国家有关部门进行组织和领导,组织语言文字学界、计算机技术界、机械工程界、心理学界、生理医学界、教育界、数学物理界……的专家学者及有关的厂商进行研制,如同制订《信息交换用汉字编码字符集·基本集》(GB2321—806763字)国家标准和《国际标准多八位大汉字字符集》(ISO—IEC,20902字)国际标准那样,制订出“中文信息处理用拼音文字”的国家标准。

“中文信息处理用拼音文字”只能是在《汉语拼音方案》加以完善的基础上进行研制,而不能是任何其他的编码方案。因此只能是“拼音文字”的直接输入转换成汉字输出,而不是音码代符的输入转换汉字的输出。

众所周知,《汉语拼音方案》是三百多年来创制汉语拼音文字的历史经验总结,[①]又是六十多年来中国人自觉地进行文字改革的群众智慧的结晶。[②]它是拼写规范化普通话(民族共同语,亦即全国通行的全民共同语)的拼音方案。所谓“拼音方案”,就是规定用什么字母符号和怎样使用这些字母符号来表示普通话的语音的方案。所以《汉语拼音方案》是最科学、最实用、最优越的拼写普通话的拼音方案。

大家都知道,从理论上和方法上讲,创制一套拼音方案可以是任意的、无穷的可能性,甚至可以是“完美无缺”的,但是要同时兼顾科学性和实用性,尤其要照顾到历史继承性和最广泛的群众性,那就绝对不是容易的事了。历史经验和现实生活的事实证明了:创制一套方案容易,但要取得多数群众同意就非常困难了,而要取得广大群众的同意就更加困难。比如从1892年“切音字运动”卢戆章《一目了然初阶》到1911年辛亥革命前20年间提出的个人方案有28种,平均每年一种以上:14种汉字笔画式,5种速记符号式,5种拉丁字母式,4种其他形式(数码式等);双拼制的23种,音素制的4种,1种音节制。其中影响最大的是王照《官话合声字母》(1900)——假名式。出版各种书籍六万多部,刊行报刊一种,列入师范和小学课程达13个省市,直到1910年才被禁止推行,历时10年。[③]又比如辛亥革命后“读音统一会”开会讨论“国音”和采定“字母”的时候(1913、2、—5),大家都坚持自己的方案,会议无从偏采哪一种。最后勉强用“记音符号”了结。[④]又比如从1913年“读音统一会”拟定的“注音字母”(1913—1918)之后,陆续又提出了“国语罗马字”(1916—1928)和“拉丁化新文字”(1931—1942),影响最大的是“拉丁化新文字”。1931—1934年在前苏联的远东地区,以海参崴和伯力为中心,对侨居苏联的中国工人进行扫盲,取得了成功。[⑤]1932年,上海世界语工作者把在前苏联远东地区开展拉丁化新文字运动的情况介绍到中国的上海。1934年正式介绍“拉丁化新文字”方案。鲁迅先生非常赞赏“拉丁化新文字”。一年之后,拉丁化新文字运动蓬勃地开展并同后来的抗日民族解放运动结合在一起形成了空前的、全国性的运动。国内外几十个城市相继成立了“新文字研究会”、“新文字推行社”、“新文字促进会”。据统计,从1934—1937年三年内成立了70个以上的拉丁化新文字团体,出版有关的书籍和刊物,书籍大约有61种,刊物36种。此外文化界有40多种的报纸、杂志登载提倡拉丁化新文字的文章或拉丁化新文字专号,有六七十种的刊物用拉丁化新文字作为刊头报头。特别是许多文化人发表赞成拉丁化新文字的意见,最著名的是1935年12月文化界688人的签名书《我们对推行新文字的意见》,在签名书上签名的人有:蔡元培、孙科、柳亚子、鲁迅、郭沫若、茅盾、邹韬奋等688人。1937年7月7日抗战爆发后,拉丁化新文字工作者到军队、农村、工厂和难民收容所开展工作。著名教育家陈鹤琴先生亲自参加了在上海难民收容所的拉丁化新文字推行工作,这是拉丁化新文字作为文字在文盲中进行识字教育的大规模实践,取得了很大的成绩。1935年延安成立了“农民新文字夜校”一百所。中国共产党领导下的陕甘宁边区政府教育部举办大批“拉丁化干部训练班”。1938年成立“边区新文字促进会”,出版新文字刊物《抵抗到底》,边区教育厅编印新文字课本和多种读物。同年冬,普遍设立“新文字冬学”。1940年1月召开“文化界救亡协会代表大会”,出席团体代表107人,个人代表331人,旁听200人。11月筹组“陕甘宁边区新文字协会”,发表组织缘起,署名的发起人有:林伯渠、董必武、徐特立、谢觉哉、罗迈、艾思奇、茅盾、周扬、肖三、丁玲、田军、张仲实、乔木,吕骥、默涵等99人,赞助人有:毛泽东、朱德、王明、洛甫、王稼祥、邓发、任弼时、李富春、肖劲光、王震、张鼎丞、范文澜、肖向荣、傅连璋、董纯才、何思敬等52人。11月7日举行成立大会,毛泽东、孙科、张一尘、沈钧儒、郭沫若、黄炎培为名誉主席团,林伯渠、吴玉章、徐特立、谢觉哉、肖三等37人为主席团。边区政府主席林伯渠宣布:边区政府已在法律上给新文字以合法地位,凡写报告、递呈子、记帐、打收条、通信等一切用途,新文字在法律上与汉字具有同等的效力。此外,中国共产党领导下的各民主革命根据地等都推行拉丁化新文字教育。新文字运动直到中华人民共和国成立后的50年代初期仍还有活力,直到1952年4月16日《新文字半月刊》出版终刊号,改为《语文知识》月刊,拉丁化新文字运动才告结束。由此可知,历史上还没有哪一种拼音文字方案有过这样多的团体、群众、出版物,也没有哪一种拼音文字方案有过这样大规模地进行教育实践以及如此广泛的舆论上的赞助和文化人、政党要人、政府要人和军队要人的拥护与支持,特别是作为一种正式法定的文字使用、推行。[⑥]

但是以上三次历史上的拼音文字方案——清末切音运动的28种方案、辛亥革命后注音字母和国语罗马字方案,以及拉丁化新文字方案,最后都没有能够成为社会和群众所接受的方案。然而从三百多年前外国传教士及外交官学习汉语汉字设计的各种拼音方案和教育、使用的实践经验,到清末的“切音字运动”(1892)止于中华人民共和国成立初的“拉丁化新文字运动”(1931—1952)的各种拼音方案和推行使用的经验,对于以后成立的“中国文字改革委员会”(1954年12月)研究和制订汉语拼音方案提供了宝贵的创制方案的历史经验和推行方案的实践经验。

中华人民共和国成立后就成立了“中国文字改革协会”(1949年10月),着手进行汉语拼音方案的研究。1952年2月“中国文字改革研究委员会”成立,设立“拼音方案”组,以研究拼音方案为主要工作,至1954年,主要进行了汉字笔画式拼音方案的研究工作。1954年12月,“中国文字改革委员会”成立。1952年2月,设立拼音方案委员会,对拼音方案进行全面、系统的研究。10月在“全国文字改革会议”上,提出了四种汉字笔画式方案,一种斯拉夫字母式方案,一种拉丁字母式方案。会后根据群众的意见并得到领导的同意,原则上决定采用拉丁字母式的拼音方案。从1950年起至1955年8月,收到国内外人士寄来的655个汉语拼音方案:从地区说有来自全国各省市、自治区及海外,从人员的社会成分上说,有教师和学生,人民解放军和志愿军,工厂、机关工作人员及华侨。同时,参考了使用过汉字的国家日本、朝鲜、越南对于汉字改革的经验。也参考了三百多年来的几十种主要方案。最后于1956年2月12日公布的《汉语拼音方案(草案)》是群众的集体创作,也是历史经验的总结。3月政协全国委员会常务委员会召开扩大会议对“草案”进行讨论,参加的有全国政协委员会、全国人大常务委员会、文化部、教育部、高教部、科学院等单位。政协各地委员会中有22个省、3个市、2个自治区、26个省辖市、4个县和1个自治州共58个单位约一万人参加了讨论。此外邮电部、铁道部、海军、盲哑教育等部门也都组织了不同规模的讨论。报纸、刊物发表了许多讨论的文章。从“草案”公布至7月初5个月内,收到全国各地及海外华侨、留学生、外国汉学家对“草案”的意见来信4300多件,其中一部分是集体来信。1957年11月1日国务院全体会议第60次会议讨论和通过了“草案”的修正案并予以公布,让全国人民进行讨论和使用,然后再提请全国人民代表大会讨论决定。1958年2月11日第一届全国人民代表大会第五次会议讨论并批准通过了《汉语拼音方案》。至此中国人民研究和创制汉语拼音方案的探索终于取得了成功,夙愿终于得以实现。

由上面简略的叙述中:切音字运动、注音字母运动、国语罗马字运动、拉丁化新文字运动和中华人民共和国成立后研究和制订汉语拼音方案工作过程直到《汉语拼音方案》正式由第一届全国人民代表大会第五次会议批准公布的整个历史发展可以证明,创制一个方案并不难,要使多数群众接受很难,要使广大的群众同意并接受就更加难上加难了。如果一个方案没有历史的继承性,没有深远的社会基础,没有广大群众的实践基础,要成为群众所乐于接受并推广使用,那是不可能的。《汉语拼音方案》之所以能成为广大群众所同意并接受,就是因为它有三百多年的历史渊源,它有几百年来群众的实践基础和深远的社会基础——从教会的罗马字方言“圣经”,到历史上从未有过的最广泛推行的拉丁化新文字运动,直至群众集体智慧的创作和历史经验总结而后产生的《汉语拼音方案》——政府领导、专家学者和广大群众相结合进行最广泛的研究、讨论、修订,反反复复几上几下最后才产生我们今天看到的拼音方案。

自《汉语拼音方案》正式公布之日起,每年有一两千万以上的小学生进行学习,累计至今大约有八亿人口学过《汉语拼音方案》,今后还将继续增加学习的人数。

《汉语拼音方案》的用途极为广泛,涉及到文化教育及生产、生活许多领域。因此被广泛地应用着。首先是给汉字注音,减少汉字读写的困难,可以提高汉语汉字教学与学习的效率,这点已被“注音识字,提前读写”的实验所证明。[⑦]其次,被用来拼写普通话,作为教学普通话的有效工具。第三,国内少数民族在创制本民族的文字或在改革本民族的文字的时候,都以《汉语拼音方案》为创制或改革本民族文字的基础,例如壮文。第四、广泛应用于对外国人学习汉语汉字的教学,外国人学习汉语汉字时都采用《汉语拼音方案》作为教学或学习的工具。第五,权威性字典、词典用它为汉语词语和汉字注音和排序,比如《新华字典》、《现代汉语词典》、《中国大百科全书》、《汉英词典》(修订版)、《汉语大词典》等,这对国内外的影响是十分广泛和深远的。第六,各种情报资料的检索、图书和资料的目录与索引、各种档案材料或资料的目录与索引、通讯地址、姓名、电话目录与检索等。第七,邮电部的拼音电报。第八,盲文、聋哑人的手语、旗语、灯光信号代码等。第九,拼写或转写外国人名地名,科技名词术语的拼写,也可以在对外文件或书刊中拼写中国的人名地名或科技术语等。第十,工业产品的型号和命名号,商品商标,商店招牌,路标站牌等。不难看到《汉语拼音方案》的应用已经渗透到文化、生产、生活许多领域中去了,有广泛的社会基础和群众基础。[⑧]

1979年6月联合国秘书处采用“汉语拼音”作为转写中华人民共和国人名地名的标准。1979年9月联合国第三届地名标准化会议决议采用《汉语拼音方案》作为拼写中国地名的国际标准。1982年8月1日国际标准化组织发出ISO7098号文件,通过决议,采用《汉语拼音方案》作为拼写中国的专门名词和词语的国际标准。这对国际情报网络检索终端的电子计算机上应用《汉语拼音方案》开辟了道路。[⑨]

所以,我们可以看到,《汉语拼音方案》在国内不但有广泛的社会基础和广大的群众基础,而且在国际上也已被广泛应用并成为联合国、国际标准化组织采用为国际标准。因此以《汉语拼音方案》为基础制订“中文信息处理用拼音文字”国家标准是最佳的选择和决策。实际上国内外已有几种汉语拼音转换汉字输入法在应用。目前的问题就是国家要集中人力物力在《汉语拼音方案》的基础上加以完善,制订出“中文信息用拼音文字国家标准”来。

由国家组织和领导有计算机制造和设计(硬件和软件)的专家、语言文字学专家、数学专家、机械工程专家、控制论、信息论、系统论专家、电子通讯工程学专家、生物仿生学专家、心理学家、医学生理学专家、教育学专家、社会学专家、大中小学教师以及计算机制造销售厂商等有关人员组成。

有人担心,用《汉语拼音方案》拼写汉语词语有很多同音词。根据研究计量语言学的统计测算,同音词在全部汉语词汇中约占10%(静态)。如果标声调的话,就只有5%了。不过在具体的言语应用中,同音词相混的比率为1%—2%左右,特别是单音节的动词、形容词、名词。在言语活动中(如写作或说话),单音词和复音词(两个音节以上)的比例大约各占一半。这些单音词大约有两千多个。我们只需对这两千多个单音节词的动态频率进行研究,制定出定型的写法,在方法上、技术上是完全可行的。实际上使用拼音文字的国家,他们的文字中也有同音词,比如英文中的Right(形容词)、Write(动词)等等,他们在词形上写法不同。我们也可以对使用频率高的单音节词保留原型,使用频率低的加以分化定型,问题是可以解决的。[⑩]

标调当然要全部标调,因为汉语是有声调的语言,声调是词语语音的组成部分。标调当然采用字母标调。“中文信息用拼音文字”国家标准的词典的词语全部标调。

有人担心全拼音输入转换汉字法,音码会太长,特别是双字母zh、ch、sh。实际情况是,汉语拼音的码长平均3.2码。为了避免编码方案要记忆许多规则的麻烦和负担,用全拼音输入是值得的——码长一点比起要记忆复杂的规则来是利多于弊。我们不赞成为缩短码长而采用双拼或其他代符的办法——如把zh变为[,z]或[z]之类的办法,也不赞成把a、n、g变为ang的办法,而是彻底地按全音素的办法输入。只有这样才能同汉语拼音的教学、学习、写作、查字完全一致起来。实际上,某些使用拼音文字国家的文字,比如德文,有些词语的字母竟达二三十个之多!即使汉语四字格的成语也很少超过二十个字母以上的。

有人担心,不会说普通话的人,或普通话说得不好的人,无法掌握汉语拼音输入。这个问题不是方案本身的问题,是使用的人的问题。既然复杂的编码规则都能掌握,为什么从小学起就学习了的汉语拼音就掌握不了呢?根据黑龙江省两县一市在小学六个教学班(1—3年级中进行三年的实验)拼读的速度每分钟127个音节,正确率98.1%,书写速度每分钟28个音节,正确率98.39%,在说话方面,声、韵、调正确率达96.86%。[①①]这是对小学一年级、二年级、三年级学生进行的汉语拼音教学的情况。小学生能做到的,其他的人更应该能做到。黑龙江虽属北方话方言区,可也同普通话有差异,照样能把普通话学好,照样能掌握好《汉语拼音方案》。其他方言区的差异各不相同,难点也不同,但都能找到解决的办法学好普通话。

还有其他一些问题需要加以研究和解决的,但都是次要的、技术性的问题。

最根本的问题是,《汉语拼音方案》是国际化的拼音方案,能与国际上的信息网络接轨,这是任何一种编码方案无法相比的。其次《汉语拼音方案》有最广泛的群众基础,自1956年“草案”公布到1958年“方案”正式公布以来,累计已有八亿人口学习过这个方案,今后每年还会有两千多万的小学生学习这个方案。这一点,任何编码方案都没有如此广泛的群众基础。第三,《汉语拼音方案》在国内已被广泛应用于各个生产领域、生活领域,在国际上已被联合国和国际标准化组织采用为拼写汉语人名、地名及汉语词语的标准。这一点,任何编码方案也无法与之相比的——渊源流长的深厚社会基础和国内外广泛的社会基础。第四、以《汉语拼音方案》为基础的“中文信息处理用拼音文字”国家标准能与小学的拼音教学相一致,也是与权威字典、词典拼音查字,以及各种情报资料检索、图书馆图书资料目录检索、各种档案资料检索、各种工业产品型号、命名代号等等相一致。所以以《汉语拼音方案》为基础研制出一套“中文信息处理用拼音文字”国家标准是最正确和最佳的选择与决策。这是涉及子孙后代的历史使命。于国、于民、于计算机产业的发展关系甚大。这是历史性重大选择与决策!再也不应该延误下去了。

注释:

① ⑨参阅周恩来:《当前文字改革的任务》,《〈汉语拼音方案〉的制订和应用——《汉语拼音方案》公布25周年纪念文集》,文字改革出版社,1983年2月,第6、209、215、227页。又:罗常培:《汉语拼音方案的历史渊源》,上引书,第22页。

②参阅吴玉章、黎锦熙:《六十年来中国人民创造汉语拼音字母的总结》,注①引书,第28页。又:董纯才:《汉语拼音方案的制订和推行》,注①引书,第33页。

③ ④ ⑤ ⑥仉海曙:《中国拼音文字运动史简编》,时代出版社,1950年6月再版,第32—68、119—120、114—173页。又:周有光:《汉语拼音三原则——拉丁化、音素化、口语化》注①引书第54—55页。

⑦ ①①广全:《黑龙江省“注音识字,提前读写”第一轮实验效果显著》,《文字改革》1985年第6期,第24—28页。《国家教育委员会、中国文字改革委员会联合召开“注音识字,提前读写”实验座谈会》上引第61页。

⑧请参阅《汉语拼音方案》的制订和应用—《汉语拼音方案》公布25周年纪念文集,文字改革出版社,1983年2月1日版,第60—208页。

⑩区别同音词的办法很多,定型化只是其中的一个手段,还有其他办法,如缩写,大小字母,屏幕显示选择等等。能够将同音词问题完全解决。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  

“泰晤士报”呼吁引进“汉语拼音信息处理标准”_电子计算机论文
下载Doc文档

猜你喜欢