论编辑手段的现代化,本文主要内容关键词为:手段论文,编辑论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、问题的提出
编辑出版工作主要由编辑主体、编辑对象和编辑手段三部分组成,这就和组成人类社会生产力的三要素(劳动者、劳动对象和劳动手段)一样,其中编辑手段主要是指编辑方式和编辑工具等。“工欲善其事,必先利其器”,编辑手段的现代化是编辑出版工作现代化的重要标志和前提,没有编辑手段的现代化,编辑出版工作的现代化就会成为一句空话。生产工具永远都是生产力发展水平的标志,我们永远都不能轻视生产工具和技术革命对人类文明的作用和影响,蒸汽机的发明曾导致了一场工业革命,同样,电脑的发明必将导致人类信息产业和新闻出版业一场新的革命。
中国是世界四大文明古国之一,我们的祖先曾经创造了光辉灿烂的文化,举世闻名的“四大发明”就有两项与编辑出版密切相关,造纸术使人类发明跃然纸上,一改结绳记事、甲骨文和“罄竹难书”的历史;活版印刷则大大提高了编辑出版工作的效率及人类文明发展的速度。它们共同开辟了编辑出版和人类文明的新纪元,正如马克思所说:中国的造纸技术及活版印刷术是科学复兴的手段、文明发展的杠杆、资本主义发展的必要条件。
自从西方人于本世纪40年代发明了计算机以来,英文的编辑出版工作效率倍增,而中文的编辑出版却只能望洋兴叹!从某种意义上说,西方人似乎是在跑、在飞奔,而我们中国人却是在爬、在“爬格子”。我们决不能小看这件事,如果我们对此视若无睹,我们就会永远落后甚至是越来越落后。
我们知道,现在的计算机键盘都是英文键盘,英文是拼音文字,它只有26个字母,用英文键盘输入英文自然轻松自如、方便快捷。英文键盘的结构与历史上的英文打字机完全相同,英文国家的人们从小就学习英文打字,他们的学生、教师、知识分子和科研人员几乎都能熟练掌握并运用这种方法从事文字工作,其工作效率自然都很高,有了电脑以后,他们更是锦上添花、如虎添翼。
如何通过简单的英文键盘来输入复杂的中国文字,一时间成了一个世界难题。对此,有外国人断言,“使用古老汉字的国家是不可能实现现代化的,方块汉字是世界上最古老、最繁难、最落后、最笨重的一种文字工具……”。于是,“汉字落后论”观点再次抬头。难道我们的古人为我们造的方块字真的就要寿终正寝了吗?一个文明的古国就要从此走向衰落了吗?
二、一个“万码奔腾”的时候
一个曾在德国工作11年,回国后就被关进仅6 平方米“牛棚”里整整6年的“反动学术权威”支秉彝, 就是在这里偷偷地研究中国汉字的出路,并取得了两项中国第一:中国第一次报道汉字编码取得成功,中国有了第一个汉字系统。这拉开了本世纪70年代神州大地一场“新的造字运动”的帏幕,给古老汉字注入了新的活力与生机。
这场运动曾吸引了中国10万之众的专家学者和科研人员从事研究、开发和探索,前后历时20年之久,其波澜壮阔之势,在世界上史无前例。这场运动在中国计算机界曾被形象地称为“码家军”的时代或“万码奔腾”的时代。
这场运动是继中国历史上的造纸技术和活版印刷技术之后的又一次“出版革命”和“文字革命”。因此北大方正喊出了“古有毕升,今有方正”的时代先声。
据不完全统计,现在已有的比较完整的汉字编码方案有750多种, 其中已经申请到专利的就有400多种, 其中制成软件并能在计算机上使用的也有100多种。
这些汉字编码方案有:区位(码)、拼音(码)、笔形码、双音码、表形码、首尾码、四角码、自然码、形声码、大众码、普及码、太极码、信息码、智能码等;用发明者姓氏命名的有:王码、钱码、易码、肖码、郑码、鸿钟码、启宏码等;在海峡对岸,台湾发明者干脆把自己发明的编码称为“仓颉码”。
键盘输入对于中文用户来说,其最大的困难在于它必须要求用户首先掌握英文指法,并同时还要熟练掌握每个汉字的拆分规则或代码,这是一套必须死记硬背的技能,尽管现在已经产生了非常完善的智能码,不用拆分汉字或死记汉字编码,只用汉语拼音就能快捷输入汉字了,但它仍然需要学习英文指法。
手写输入是通过计算机文字识别来解决汉字输入的一种新技术。文字识别是让电脑模仿人认字的过程,是模式识别和人工智能最具有挑战性的研究课题之一。
早在80年代,我国就开始在汉字识别研究方面进行探索,并取得了重要的突破和进展,例如中自公司(中科院自动化所办)推出的“汉王99”联机手写汉字识别系统;清华大学电子工程系在科研成果基础上推出的汉英文混排印刷文本识别系统(清华OCR)等一系列产品, 对解决汉字识别自动输入,具有广阔的应用前景和实用价值。
汉字识别包括脱机的印刷体和手写汉字识别,以及联机的手写汉字识别三种。从困难程度说,印刷汉字识别和联机的手写汉字识别比较容易,脱机手写汉字识别最为困难。从识别角度看,脱机识别和联机识别差别很大,联机的手写汉字识别由于笔划迹可以获得,使得利用笔划信息进行结构分析成为可能。脱机的汉字识别,是典型难度的模式识别问题,其困难程度居各种汉字识别之首。由于手写的汉字的严重无规则性和无穷无尽的手写差异性,句法模式识性和单纯结构分析方法在脱机手写汉字识别中作用有限。只能以笔划分析表达汉字的结构骨架,以属性分析表达汉字构成部分的种种可能的随机变化,提出以这种结构词义模型将汉字的结构特征与统计特征统一于一体,以适应手写体汉字变化莫测的大模式集合。也可利用句法模式识别方法,在其中融入随机文法,以适应手写体汉字的千变万化。
目前,我国的汉字识别技术已经走在了世界前列,其上市的产品的识别正确率已经达到了98%以上,但由于手写输入汉字的速度较慢,且问题也还有很多尚未解决,因此,现在,人们把目光投向了语音输入技术。
自然语音是人与人之间以及人与计算机之间最方便的一种信息交换方式。利用自然语言这种人们日常生活最常用的方式给计算机输入指令,自然十分方便。汉语语音具有独特的单音节声韵结构,语音识别对于汉语来说,具有特别重要的意义。
要使电脑能够直接听懂人类语言,关键在于语音识别。语音识别是将输入语音经过数字处理后得到一个模式,将此模式与预存的经过训练的参考模式进行比较,从而确认是说了什么短语句子。
语音理解系统是语音处理的重要环节,对语音识别,其识别的对象是词汇,而语音理解的对象是语句,语句是由词汇组成的,但不是词汇的简单组合,组合方式取决于语法规则、语义内容和使用环境,语音理解系统一般包括语音分析与识别、词语匹配、语义分析和语句组合等,语音识别与理解是人机口语对话的基础,是机器人智能化的必要条件。在口语翻译、口授打字、口语控制、管理自动化与指挥自动化方面都期待着数字语处理和语音识别与理解技术的发展与提高。
随着计算机技术的不断发展,键盘输入、手写输入和语音输入等三种不同的文字输入方法,将会根据不同的需要,形成鼎足之势。从长远来说,由于语音方式是人们最容易、最直接和最自然的表达人类思维的方式,因此,它可能会最终占优势的地位。
北京四达电脑公司曾经开发研制过一种汉字语音输入方案,其产品曾经一度推向市场,我曾经去试过一次,我对着话筒说了一句话,电脑先是显示出这句话的同音字,一按回车,基本正确。
但是,四达声控系统后来没有得到进一步发展、推广和普及,其原因,一是语言声学和现代语言学发展的理论与技术问题还没有完全解决,二是研究开发人员出国并把技术专利带走了,三是因为成本和产品价格太高(当时,这套软件及话筒售价是9800元),一般人买不起。现在,中国科学院声学研究所和自动化研究所都在开发研制这一产品,中自公司已经率先把该系统及其产品推向了市场,并开始了大力的推广与普及(而且价格也比前面的便宜了10倍)。
现在看来,编辑手段现代化的重要意义主要表现在以下几个方面:1.通过文字输入实现了即打即排即校,即时录排取代了传统的誊誊抄抄,修改方便,运用自然,效率倍增;2.编排系统软件功能增强,实现了从书面编辑到屏幕编辑的转化;3.信息趋多趋广,版面设计自如;4.数据库及磁盘管理系统的引入,实现了磁盘检索的转化,取得了事半功倍的效果。
三、编辑手段的现代化
编辑手段现代化的标志之一就是计算机在编辑出版过程中的广泛应用,伴随而来的是编辑工作的手工操作变成由计算机控制的信息处理,由此给编辑工作带来了一场前所未有的革命。
传统的编辑方式是从稿件登记、审理、编排加工、发排、校对到付印,最显著的特征就是手工操作贯穿其中,并辅之以“纸、笔、剪刀、浆糊”,而当以电子技术为核心的微机排版、激光照排系统、图形扫描涉足出版系统后,编辑模式发生了很大变化。
首先,在接到作者来稿后,可将与该稿件有关的信息存储在微机内,之后,将稿件处理情况补充进去。如有作者查询,很快就能将结果提出来,必要时还可打印成书面文字。另外,对每位编辑人员的工作量,查询起来便捷及时,为编辑部工作量化管理提供了方便。
其次,由于微机排版系统具有体积小、易操作、效率高、功能强的特点,可由编辑人员自行操作,满足编辑与排版的各种要求,编辑人员可利用先进的输入软件和排版软件,在微机上进行编辑加工,边审读稿件边向微机输入(如接到的是作者软盘可省去输入;如需外审,可建立审稿专家数据库,查找审稿人也十分方便)。然后可以在微机屏幕上完成版式设计和版面加工组合,校对完毕后,即可付印。
可以预见,在不久的将来,随着计算机网络的进一步完善,信息高速公路的开通,编辑工作有可能率行实现办公家庭化、接稿、审读、编排、校对就可在家中的微机上一并完成,然后通过网络传至印刷厂,即可制版,实现无软盘操作。
伴随着计算机应用技术在编辑工作中的广泛渗透,编辑技术手段也发生了很大变化,从而为编辑从事务性劳动中解放出来,更多地转向创造性劳动提供了新的条件。
编辑利用微机进行文献查询检索,在广阔的信息世界里搜集各种材料、成果,掌握学术动态及学科发展趋势。这种高度自动化手段能大大提高编辑的工作效率,一方面保证编辑有更多的时间投入到选题、组稿及科研上,另一方面又为编辑搜集更多的信息提供了方便,使编辑的组稿、编稿有更充分的选择余地,这无疑对提高书刊的学术质量大有裨益。
编辑手段现代化,为编辑提供了充分展示其才能的机会,使编辑的创造性劳动得以更具体的展现。如,微机排版的采用,使书刊版式、图形随心所欲地在屏幕上展现,这是传统的印刷技术无法比拟的,同时,编辑的构思很快在屏幕上展示,并能即时自如地修改,这会激发编辑的工作热情,推动其创造能力的发挥。
由于多媒体的出现,使编辑的表现手段不再仅仅是印刷品,而是具有声、光、画功能的光盘,这些都大大突破了过去印刷品对编辑思想的限制,为编辑提供了更广阔的创造性活动空间。
四、迎接“信息革命”的挑战
计算机的发明与应用,对人类古老的文明带来了一场伟大的革命,这是一场对以纸张为信息载体并在纸张上进行文字处理的古老编辑出版方式的革命,因此它才被称为一种新的“文字革命”、“出版革命”和“无纸革命”,其本质是一种“信息革命”。
根据清华大学数据研究中心副主任、北成集团董事会主席孙庆君博士的观点和研究,从本世纪40年代开始至今,计算机已经走过了短暂而辉煌的四个阶段或四个时代:
(一)硬件时代
在计算机发明的最初40年,计算机的硬件开发与生产一直是人们关注的重点,这是信息产业发展的初始阶段。在这个阶段,硬件生产大约占信息产业总产值的50%以上,其主要企业代表有美国IBM公司、 苹果公司和英特公司。硬件生产的标准化和工业化,使它们的市场占有率名列前茅。1982年,IBM开发上市的“IBM—PC”成为世界个人电脑的工业标准并很快风靡全世界。所以,IBM 喊出了那个时代的口号:“无论一小步,还是一大步,总是带动世界的脚步!”
(二)软件时代
从本世纪80年代到90年代初期,信息产业进入了以软件开发为主的时代。在IBM发明了PC机并进行批量生产以后, 标准化的系统软件的开发与生产开始提到了战略地位的高度。当时,计算机的运用领域迅速扩大到众多部门,不同部门有不同的应用软件;硬件生产技术的迅速提高与成本的迅速下降,硬件生产与市场的产值比例迅速下降到信息产业的50%以下。以此为界,信息产业进入了软件时代。软件天才比尔·盖茨预言到80年代即将出现“软件危机”,毅然从大学退学,于1975年创办了“微软公司”。从此,微软公司势如破竹,迅速占领世界个人电脑操作系统软件市场,成为世界上亿台电脑的标准操作系统(先是DOS 操作系统,后来又开发出了更加高级、更加灵活方便的窗口式Windows 操作系统)。1994年,比尔·盖茨以40亿美元的个人资产居美国首富,几个月后由于微软公司股票上涨,比尔·盖茨的个人资产又涨到70 亿美元,到1996年,他以192亿美元的个人资产成为世界首富, 创造了信息时代的第一个科学神话。
(三)网络时代
90年代是世界电脑和信息产业进入网络阶段的时代。1993年,美国总统提出了“信息高速公路”的设想,这标志着信息产业网络时代的开始。在计算机硬件技术发展到486以上时,普通的PC 电脑的数据处理能力已经达到十年前的巨型机的水平,486/DX100的数据处理速度已经达到每妙上亿次,大容量硬盘,尤其是光盘的出现使其存储能力也迅速提高,软件平台日益成熟,计算机的运用领域也从数字、文字扩大到图像、声音、影像,多媒体的出现更加突出了计算机网络对信息产业发展的作用,建设超大容量、宽带计算机网络通信系统即信息高速公路便提上日程。“信息高速公路”的提出,立即引起了全世界所有发达国家和大多数发展中国家的强烈反响,数以千亿甚至数以万亿美元的投资热潮将人类迅速推向信息革命的更前沿。
网络时代创造了INTERNET和NETSCAPE新的科学神话。INTERNET网络本来是一个军事网络系统,后来逐步发展成为一个普及性的商业和公用网络系统,1993年约有800万台电脑联入此网, 它标志着网络时代的开始。现在,INTERNET网仍以每月10%以上的几何级数增长,到1996年底,全世界已有约7000万台电脑联入其中,3年多时间增长近100倍,成为世界最大的网络系统。
1994年,年仅22岁的安德森创办了NETSCAPE(网景)公司,开发网络上使用的浏览器软件。1995年8月,网景公司在纽约上市, 一夜之间,它从一个原始资金只有1700万美元的小公司变成了20亿美元的新巨人。从此,硬件和软件退出信息产业的主战场,成为配角。网络争霸成为世界经济竞争的焦点。
(四)数据时代
信息产业可以分为传统的和新兴的两种。传统的信息产业可以追溯到很久以前,如活版印刷、新闻出版和广播电视。自20世纪计算机诞生以来,特别是进入60年代,出现了以计算机和现代通信技术为手段的新兴信息产业。这种新兴的信息产业对传统的信息产业必将产生一场革命性的冲击,并使之焕然一新。
信息产业经历了硬件时代、软件时代、网络时代三个发展阶段,在这三个阶段发展的基础上必然进入第四个阶段——数据时代。信息产业的核心是数据资源的开发生产和消费,计算机硬件、软件和网络只是为数据的存储、组织和流通提供基础的,因此,数据是信息产业的真正内涵。美国经历了三个发展阶段后也发现了数据产业的潜力,目前虽然已有DIALOG等数十家超十亿美元的数据公司,但还未形成真正的产业。
数据时代的标志是数据资源的开发、深度加工和流通使用。这里的数据是广义的数据,它是指一切计算机可以加工处理的数字、文字、图像、动画、影像等。数据时代的一切皆化为数据形式,联机数据检索、电子图书、数字音像、数字特技电影、数控智能化建筑、数据货币、 CIMS、MIS及模具革命3D系统等都是以数据的方式进行加工生产, 以数据的方式进行交换和流通。到那时,计算机硬件、软件、网络等已经充分的成熟并降低成本,成为普及性的微利产品,唯有数据产品(联机数据库、光盘和以数据库为核心的专用集成电路及专用电脑等)成为人们日常必需的消费品,数据产品的产值和利润将占整个信息产业的一半以上。
目前,数据产业主要包括联机数据库服务和CD—ROM 光盘数据库服务两部分。前者以大型计算机存储的各类数据库为中心,经通信网络与遍及各地的终端相连,向用户提供联机查询服务;后者则把各类数据库存储在CD—ROM光盘中,直接发售给用户, 在微机上实现光盘查询服务。
据1993年统计,全世界已有5500多个商用数据库、700 多个联机服务系统,通过四通八达的通信网络,昼夜不停地向遍及全球各地的用户提供联机数据库服务,与此同时,还有2200多种CD—ROM光盘数据库, 以每年几十万套的CD光盘发行量,寄往四面八方,运行在世界各地的微机或局域网中。80年代以来,数据产业的产值在发达国家每年以20%的速度递增。进入90年代后,由于以图像、声音、文字一体化处理为主的多媒体数据库的迅猛发展,数据产业,特别是多媒体CD—ROM 光盘数据库的服务,将会以更高的速度持续增长。