数字时代词典出版业的思考_语料库论文

数字时代词典出版业的思考_语料库论文

数字时代词典出版业问题三思,本文主要内容关键词为:出版业论文,词典论文,数字论文,时代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G239 [文献标识码]A [文章编号]1009-5853(2010)06-0086-05

以计算机为核心的现代信息技术的飞速发展给传统出版业带来了巨大挑战,即在出版业数字化浪潮中“存”与“亡”的新课题,词典出版业亦不例外。进入21世纪后,辞书领域发生了前所未有的变革:数字化出版或电子介质化制作渐入主流,词典内容被转换成二进制编码输入计算机,并以数据库形式存储到磁盘或光盘上,再利用计算机进行随机检索,从而形成机读词典或数字化词典(当下以电子词典、计算机词典与网络词典为经典型式)。数字化词典的诞生打破了传统词典千百年来一直以印刷文本形式存在的知识载体形象。事实上,以电子媒介为中心的数字化浪潮正影响和冲击着辞书编纂、出版与发行的各个环节,引起传统辞书包括编纂、出版与发行在内的行业结构的裂变与重构。以互联网为核心的信息多媒体技术又使得这一行业裂变或挑战更为复杂。面对数字化时代词典出版业的新动向,业界有困惑,有茫然,更有认识论层面的异议与争论。显然,唯有立足辞书学学理与时代特征,理性地反思困惑,厘清异议,方能认清形势,辨析走向。

1 纸质词典的市场问题

数字化时代数字技术成为信息处理的主要手段,这直接造成词典载体的深刻变革。传统上只能在平面中以线性方式提供知识的纸质词典转变为以超链接为主要特点的能够多方位、立体化、多媒体化提供知识的数字化词典。数字化词典迎合了后现代消费思潮中印刷文化向视觉文化转型的“大众悦读”这一时代特征,强烈冲击并挤压着纸质词典的生存空间。纸质词典的未来究竟有没有市场?这是萦绕在大多数辞书出版社心头的隐忧。

1.1 词典文本的特殊性

词典文本不同于普通印刷文本(例如报纸),具有自身的特殊性,其数字化转型后的一些优势也许就有悖于该特殊性。例如,词典文本提供信息具有权威性,人们也因此对词典有着先天的敬畏与依赖。然而,数字化辞书(例如“维基百科”)宣扬的读者互动性恰恰就消解了这种权威性,《不列颠百科全书》主编罗伯特·麦克亨利(Robert McHenry)将“维基百科”这种全民互动参与编写的百科全书称为“公共厕所”,就是这种看法的一个典型例证。但是,就词典用户的心理期待而言,纸质词典树立的传统权威形象在相当长时期内很难消失。再如,词典文本是自成一体的知识系统,具有完整的、相互支持的微观结构、中观结构与宏观结构,比较切合使用者的认知学习机制。然而,数字化词典(尤其是手机词典等型式)囿于自身介质的制约,无法向使用者整体地、真切地展示这一系统或结构,因而不太容易张扬本体与认知之间的积极互动关系。再如,有些特殊类型词典,像学院型词典(非查考型)、规范性详解词典、历史型词典等,纸质形式也许更能发挥其相应功用,至少在当下不太适合以电子介质形式输出,尤其是出于书籍保存、学术研究和维护民族语言规范化等目的。

1.2 词典使用行为的特殊性

数字化媒介的盛行在一定程度上归因于数字化时代人们对视觉刺激的追求。这一感官刺激的深层内涵是:生活节奏紧张的消费大众实在没有时间和心情去细细体悟精英文化的内在意蕴、言外之意以及诗化的叙述语言,而喜欢浅显、轻松、活泼的文化快餐,即人们严重忽视审美形式与深度,而追求审美体验的表层化和感性化。作为精英文化代表的词典的使用有其特殊性,不能等同于快餐文化那样最直接、最省时省事地取用的“悦读”方式。例如教学词典的使用,只有当学习者全身心浸泡到现代词典精选、到位的语言体系中,把握并体悟编纂者构建的语言教学机制①,宏观上感受语言系统,微观上辨析语言精妙,才能真正有益于学习并掌握语言。但是,当下数字化词典只是追求高大全,一味罗列各种内容。而且,根据国外科学界的最新研究,数字化阅读时受到的干扰很大,很难让读者沉浸到文本中获得自足的阅读体验。可见,就认知学习功能而言,数字化词典无法与纸质词典相提并论。再如,对于使用者而言,数字化词典的使用大抵是被动的,使用者很难将之作为一种特殊的文化文本快乐地进行阅读和欣赏。正如某网友所言:“我还是习惯于纸读,原因有:方便、随时可读;喜欢书香沁人心脾;还可以随时写下感想,可以反复与读记。读到激动时会欣喜若狂,读到深刻处会点头称赞。”可见,数字化词典并不符合部分读者群的阅读习惯与阅读心理。而且,对于学习型语言活动来说,纸质词典更能让使用者处于一种主动的学习状态,从而张扬本体与认知之间的积极互动关系,增强词典查询的学习效果。

1.3 数字鸿沟的现实存在

在数字化时代,伴随信息技术加速发展而产生的一个重要社会问题就是数字鸿沟(digital divide)的存在。根据经合组织(OECD)2001年发布的《理解数字鸿沟》的报告,数字鸿沟是指个人、家庭、企业、不同社会经济发展水平的地区,在享用信息技术的机会及利用互联网从事各项活动的水平之间的差距。通俗地说,就是指“不同社会群体之间在拥有和使用现代信息技术方面存在的差距”。张新红总结了数字鸿沟产生的五个主要原因,即经济发展或收入水平、教育水平或知识能力、政策环境、个人习惯以及年龄、体能等生理因素②。就数字化时代的工具书而言,数字化词典的利用显然是数字鸿沟考量的一个重要指标。我们以数字化词典中经典的电子词典为例,根据对电子词典使用率的调查,发现导致数字鸿沟存在的原因至少涉及以下方面。

一是经济发展或收入水平。根据调查,在北京、上海、广州等经济发达城市中,电子词典在高中生中的拥有率接近50%;而在经济发展落后或相对落后的地区,相应平均拥有率则低于20%,纸质词典仍然是主要的学习工具。

二是知识能力,个人习惯或年龄、体能等生理因素。根据调查,当前电子词典的使用主体主要集中于中学生与大学生,包括中年人、老年人等在内的其他群体很少使用电子词典。这是知识能力还是个人秉性使然?抑或是年龄、体能等生理因素作用?虽然该问题无碍本例要旨,但值得深入研究。

1.4 当下数字化词典的局限

仍然以电子词典为例。最早的电子词典诞生于20世纪80年代末期,迄今已有逾20年历史。那么,电子词典的最新技术状况如何呢?我们以两款最新版主流电子词典为例。

名人活词典i530。完整收录包括《新牛津英汉双解词典》《牛津进阶英汉双解词典》等6部牛津正版词典及包括《汉英大辞典》《新英汉词典》等5部中英文词典;牛津原版音库发音,MP3格式,更标准、清晰;搜天下智能搜索引擎;词典会话均为MP3真人发音;中英文双向整句翻译功能。

卡西欧E-SF200。系统收录包括《英汉大词典(第2版)》《新牛津英语大词典(第2版)》等在内的26部权威辞典;单词跳查;追加查询;模糊查询;例句、惯用语查询。

与第一代电子词典相比较,当下电子词典显然信息容量更大,使用更为方便,而且可以自由扩充词库或利用互联网下载词库进行词库自动更新。但问题是属于电子词典自身真正的、独特的结构范式并没有形成。电子词典的结构范式显然不能等同于纸质词典的结构范式,否则就抹杀了数字技术与电子介质对于词典编纂与出版的意义。然而就结构范式而言,当下电子词典基本上都是纸质词典的完整或系统收录(即通过正式购买版权,详细收录纸质词典的所有内容)。它们的所谓“学习必备”“深化学习”“深化研究”或“专业实用”等“数字化”功用,只是掠印刷原版之美而已。

综合以上四类主要因素可以判断,在未来相当长的一段时期内,纸质词典仍将有生存的理由与市场,出版商也有着相应的盈利空间,只是竞争将更为激烈。

2 词典出版业的发展方式问题

2.1 切实采用现代化词典生产方式

科学技术发展促进生产力水平提高,生产力水平提高必然促进生产方式的变革。词典的数字化或现代化生产是科技进步的必然产物,也是数字化时代对词典出版业的基本要求。

毋庸置疑,与传统生产方式相比较,以计算机技术为核心的工具改良能够使辞书编纂与出版的速度、质量大幅提高。以语料库为例,它是词典编纂数字化的基础,也是利用计算机辅助实现词典编纂工作自动化的先决条件。语料库已经成为当下词典编纂的基本手段。从编纂方式来说,利用语料库构建的词典编纂平台改变了陈旧的词典编纂方式,使词典编纂走上形式化和标准化道路。词典的编写、修订、检索因此变得非常便捷。从编纂质量来说,语料库能够为词典编纂提供大量真实、可靠的语言素材,在保证词典可用性、准确性和时代性的同时最大限度地避免了经验主义,因而词典编纂更趋近于语言实际,更为客观和科学。鉴于语料库如此强大的优势,近十几年来,充分利用语料库已经成为国内外词典编纂者的共识,各家词典出版商都非常重视应用现代技术、采取多种渠道进行语料库建设,计算机和网络技术也被广泛运用到词典语料库建设中;语料库规模不断扩大,与之配套的检索技术也日臻成熟,极大地方便了词典编纂工作的开展。

新闻出版总署副署长阎晓宏在《我国将大力实施数字出版战略》一文中指出:“未来几年,国家将大力实施数字出版战略,以推动传统出版业的产业升级和革新。”对于词典出版业而言,必须也只能在现有辞书编纂、出版数字化和网络化工作的基础上,充分信任并利用现代科学技术,继续加大投入力度,有系统、有目的地调动科研、教育及IT企业的力量,在建设优质语料库与数据库的前提下,积极开发辞书编纂、编校及质检软件,开发计算机词典编纂辅助系统或自动化生成系统,积极实现传统词典生产方式的现代化变革,以在此基础上强势融入未来词典编纂与出版事业的开拓与创新潮流中。

2.2 积极建构词典出版业的数字化运作思维

在积极实现传统词典生产方式现代化转型的同时,词典出版业必须保持清醒认识,即理性捋清现代科学技术与词典学之间的内在关系,辩证思考词典数字化生产方式中的积极方面与消极因素(例如语料库的弱点)。这是数字化时代词典出版业一个重要的认识论前提。然后从这一前提出发,词典出版业必须尽快建构数字化运作思维,并将之渗透到词典学本体理论、词典编纂实践、词典出版、词典盈利和词典营销等各个维度。

2.2.1 数字化本体理论思维

词典学作为一门独立学科,具有符合自身特质的知识系统。需要注意的是,这一系统发轫并成长于纸张介质与(人类)手工技术的土壤之上,一旦这一土壤发生裂变或更新,相关理念、原则、原理和方法等必然发生变化。因此,在践行数字化词典生产方式的同时,词典学包括编纂技巧与原则、词典史学、词典结构、词典类型、词典使用、词典评论等内容在内的本体理论研究,都必须实行数字化转型,否则就失去了信度与效度。

2.2.2 数字化编纂思维

以英国柯林斯公司CoBuild词典项目为例,现代化词典编纂工程整体上可分为四个部分,即建立语料库、建立数据库、词典设计、词典信息的抽取与编辑。数字化思维必须贯穿到所有四个部分中。这对传统辞书编纂者与编辑来说都是一个崭新考验。先以辞书编纂者为例。他们在进行项目规划、编写体例、收词、释义、配例等工作时,必须立足数字化生产方式,还必须时刻考虑并熟练使用辞书编纂、编校、质量检测等各种软件。再以辞书编辑为例。传统词典出版业拥有专业化的编辑队伍,他们不但接受过编辑培训或有着职业化的编辑经验,而且接受过辞书编辑的专业培训。但是在数字化时代,词典出版的数字化转型使得传统词典业的业务观念发生了改变,同时也对编辑人才提出了更高要求。因此,他们不仅要有良好的业务素质,而且要有数字化编辑、网络传播与信息化建设的理念与技术。

2.2.3 数字化出版思维

引进数字化技术,促进出版流程的技术革新,实现信息化建设。例如,开发并实施出版管理信息系统,让传统词典出版流程,从选题申报、发稿、排版、校对到提印、付印、样书入库、发行等,都实现计算机网络化管理。这一数字化系统有助于规范流程,强化制度管理,从而提升管理水平,最终提高出版的效率与质量。再如,加强包括排版、数据交换等在内的词典印前工艺的数字化技术应用,努力搭建词典编纂链与出版链之间的透明、顺畅、共享的数据平台。还可确立“数字化出版”为人才工程建设的重要指标。

2.2.4 数字化盈利思维

数字化时代,数字出版的低成本效应极大地削减了传统出版的盈利水平。正如柯尔盖里弗(Kilgarriff)所问:“现在,词典在网络、微软office软件或其它产品中都是免费使用的,词典出版商的收入源(income stream)在哪里呢?”③随着词典数字化水平的逐级升高,词典的免费使用率也将越来越高。那么,词典出版商该建立怎样的盈利模式以实现数字化生存呢?显然,这里涉及的因素很复杂,不同出版社有着不同的条件与取向。本文提出三点供参考。第一,积极发挥传统词典出版商在编纂队伍、编纂经验、社会权威性等方面的优势,争做数字化词典优质内容或源数据的提供商。纸质词典与数字化词典在一段较长时期内融合的程度将更深,融合的范围也将更大,而其间的相互依赖性不会消失,优势互补、相互促进的态势将更为普遍。正如微软高管派利希(Parish)所说:“微软是词典出版商的合作伙伴,而不是竞争者”,而且,(微软与词典出版商)有着许多新的“‘电子机会’(eopportunities),例如为微软产品出版附加产品(add-ons)”。第二,做大做强传统词典出版业,借以盈利。正如上文所讨论的,纸质词典仍将有自己独特的市场。根据Levine的调查,尽管网络免费词典大量存在,英语词典的销售仍然有着上升迹象⑤。不过,这一市场竞争很激烈,只能是实力雄厚企业的天下,正如Esposito所说:“(词典出版业增长的停滞)将有助于词典市场领导者获利,例如梅里亚姆-韦伯斯特公司(Merriam-Webster)、牛津大学出版社等。”⑥第三,开发优质的“碎片化”的创新型纸质词典。柯尔盖里弗研究后指出:“(当前)正在崩溃的是单语词典市场——‘家用词典’市场的象征。不同的市场,尤其是繁荣的EFL(English as a Foreign Language,英语作为外语),以及为旅游及语言学习而使用的双语词典,情况并非如此。”⑦值得提醒的是,在构建盈利模式的同时不要忘记探讨知识产权保护的途径和方法。

2.2.5 数字化营销思维

积极有效的营销模式是实现盈利的有力保障。数字化时代词典营销思维的核心是充分利用网络,在传统营销模式的基础上开拓网络营销模式,即将发行业务、宣传业务、广告业务和营销活动逐步聚合在网络平台之上,从而实现词典营销的数字化联动。这是词典未来的生存基础,也是词典向数字化进军的基地。这里强调两点:第一,集合词典工具书的特点,努力建立一套基于互联网的,集成互动交流、个性化咨询订购、在线学习、网上销售的数字化服务体系,探索网络经济下词典出版的新模式;第二,突显词典工具书的特点,既不能采用一般图书的营销模式,也不宜完全依靠市场经济原则进行调节。

3 词典出版业的创新问题

3.1 数字化词典创新的根本在于自身范式建构

当下所谓的数字化词典实际上都是纸质词典的电子版,更有甚者,是纸质词典的电子浓缩版(即剔除了纸质词典中语法、语用等大量教学信息)。这就是说,当下数字化词典作为一种革新的新型工具书并没有自己独立的、具有要素意义的范式系统——它与纸质词典的根本差异只是建立在介质技术递进而产生的差异基础之上,而不是根源于包括体例、结构、类型、原理和功能等要素在内的范式张力。这显然抹杀数字技术与电子介质对于词典编纂与出版的革命意义。电子介质替代纸张介质表面上只是介质的变化,但是它对纸质词典范式系统的影响应该是全方位的:从外在的结构,呈现的内容,到内在的功能,无处不受到冲击或革新。既然如此,数字化词典借用的纸质词典范式系统显然已经身魂异处,形不关内。

因此,对于当下数字化词典而言,创新的根本不在于依靠科学技术将纸质词典的内容进行数字化平移,而在于先验探索并建构自身真正的、具有要素意义的范式系统。这一工作意义极为重大。首先,它将优化并发展与科学技术水平直接契合的词典学知识系统或理论体系。其次,建构在科学技术水平基础之上的范式系统能够科学、有效地指导数字化词典产品的编纂、开发、出版与研究。第三,先验的词典范式系统能够产生强大反推力,最大程度地发挥包括电子介质、数字技术等科学技术在数字化词典领域的作用。

3.2 开发优质的“碎片化”纸质词典

与数字化词典相比,纸质词典的一个重要弱点就是有着空间的制约。但是就现实的信息传递而言,细分化与精简化的信息传递却占据社会生活的主流。这就规避了纸质词典的先天弱点,而恰恰给了纸质词典一个创新的源泉与稳定的消费市场:开发优质的“碎片化”纸质词典,以最佳地满足细分化与精简化信息传递过程的要求。就时代特征而言,这也符合当下后现代消费文化语境中“宏大的民族—国家寓言式叙事”明显转向“个人化、私人性小叙事”的潮流。这里的“碎片化”操控指标,可以依据性质(例如专门词典、教学词典等)或读者群(例如中小学生词典、大学生词典等),也可以依据年龄层(例如幼儿词典、少年词典等)或特殊消费目的(例如考试词典、消闲词典等),但创新的考量标准只有一条,即是否最佳地实现了专业化、个性化与人性化,最优地暗合了操控指标内蕴的原理与机制。

3.3 开发最大限度体现数字化词典特质的纸质词典

不管是普通消费品还是文化消费品,生产的终极依据只能是消费者的消费需求与消费风格。数字化词典的当下市场接受度说明,数字化词典的某些特质能够较好地迎合部分消费者群体的需求或风格,不管其是否具有理性或科学性(例如外语界一直批评电子词典对于学生外语学习的负面影响)。这对纸质词典编纂与出版的启示是:最大限度地迎合并体现数字化词典的某些特征。例如,数字化词典迎合了当下视觉符号占统治地位的“图像消费时代”或“读图时代”的特征,因此,纸质词典的编纂与出版可以适当放大“视觉化”特点,最大程度上配置各种富于趣味性、形象逼真的插图,造就视觉化情势,以满足数字化时代大众的“悦读”心理。当然,这里的意蕴并非如此简单,值得学界深入探究。

(收稿日期:2010-02-26)

注释:

①陈伟,张柏然.教学功能突显与词典范式演变[J].外语界,2007(6):35-44

②张新红.什么是数字鸿沟?[J].电子政务,2008(11):12-15

③⑦Kilgarriff A.If dictionaries are free,who will buy them?[EB/OL].Kernerman Dictionary News,Number 13,June 2006

④Parish J.Microsoft and dictionary makers:defining partnerships[EB/OL].Kernerman Dictionary News,Number 12,July 2004

⑤Levine C.M.The coming boom in English lexicography:some thoughts about the World Wide Web (Part One) [EB/OL].Kernerman Dictionary News,Number 9,July 2001

⑥Esposito J.J.Dictionaries,another Netscape?[EB/OL].Kernerman Dictionary News,Number 10,July 2002

标签:;  ;  ;  ;  

数字时代词典出版业的思考_语料库论文
下载Doc文档

猜你喜欢