EPUB标准及其在我国数字图书馆建设中的应用,本文主要内容关键词为:在我国论文,数字图书馆论文,标准论文,建设中论文,EPUB论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
目前,国内外电子资源的格式标准多达数十种,包括私有格式和通用格式两类,前者如亚马逊的 AZW、方正的CEB、超星的PDG、中国学术期刊网的CAJ和维普的VIP等,后者如Adobe的PDF。由于缺乏统一的资源标准,致使围绕众多格式开发出来的阅读软/硬件互不兼容,造成资源的重复建设。因此,建立开放、独立的资源格式标准就成为数字出版和数据产业的共识。近年来一种新的格式标准——EPUB迅速被国际社会认可和接受,成为该领域的事实标准,本文将简要介绍EPUB标准的基本知识,并着力探讨其在我国数字图书馆建设中的应用。
1 EPUB标准简介
EPUB是电子出版物(Electronic Publication)的缩写,是一个免费和开放的电子书标准,由国际数字出版论坛(International Digital Publishing Forum,简称 IDPF)于2007年9月发布,以取代先前的开放电子书标准(Open eBook Standard)。从发布至今,EPUB经历了三个版本:EPUB 1.0、EPUB 2.0.1、EPUB 3.0,其中,EPUB 3.0于2011年5月正式确定。EPUB3.0标准包括四个子标准,分别是:(1)EPUB Publication3.0,定义了EPUB文档的出版物层面的语义和建档要求;(2)EPUB Content Documents 3.0,定义了EPUB出版物中XHTML、SVG、CSS的使用;(3)EPUB Open Container Format(OCF)3.0,定义了将系列资源压缩至统一文件的格式和处理模型;(4)EPUB Media Overlays 3.0,定义了文本与音频的同步化格式和处理模型[1]。
支持动态可适应性布局和获取是EPUB标准开发和设计过程中的首要考虑因素。根据显示区域的大小、用户的喜好和设置及其他环境因素,EPUB文档可以自动执行文本布局和页码调整,这样在阅读电子书时,就不至于因为显示屏较小而使页面“溢”出到屏幕外。EPUB 3.0支持CSS模式,能够实现纵、横布局与左右或右左书写转换,并且支持不同作者选择的显示方案,例如,同一文档在平板电脑处于横向位置时显示两个页面,在平板电脑处于纵向位置时显示一个双栏页面,但在移动手机上只显示一栏内容。
适应当代数字出版的变化,EPUB 3.0对EPUB2.0.1进行了一系列重要变革,增加了许多功能,包括:支持多媒体格式,可以在电子书里播放视频、音频等内容;支持数学公式等复杂内容的显示;支持文字朗读技术,并使声音与文本同步显示;支持非罗马文字格式,如日语、汉语和阿拉伯语,让几种语言格式的电子书内容被检索,以加强EPUB标准对国际出版的支持;更好地支持DAISY有声书标准,为盲人提供听书服务。
EPUB标准推出之后迅速被各方接受,目前,许多阅读软件都支持EPUB标准,并开发了专用阅读软件。由Adobe公司发布的Adobe Digital Edition是最早支持EPUB标准的阅读软件,该软件可以在Windows与Mac系统平台上运行,其他比较著名的如 Google Books、苹果iBooks等都对EPUB标准有着良好的支持。支持EPUB标准的阅读软件见下表。
许多阅读硬件如电子书阅读器、平板电脑、智能手机等也支持EPUB标准,比较著名的是苹果公司开发的系列产品,包括iPad、iPhone与iPod Touch,在 iOS 3.2系统平台上安装Lexcycle Stanza或iBooks,即可实现对EPUB标准的支持,其他硬件包括安卓设备(使用FBReader、Aldiko)、Nook、BeBook、Opus、 Boox、COOL-ER、Cruz、eClicto、ECTACO jetBook与ECTACO jetBook Lite、eSlick、iRex 800与1000、 iRiver Story、Kobo、Sharp Zaurus、Plastic Logic、 PocketBook、Sony eReader等。在国内,翰林阅读器是较早支持EPUB标准的阅读硬件。
目前,除亚马逊外,国外大部分出版商和资源商都支持EPUB标准,出版商如西蒙·舒斯特公司(Simon & Schuster)、企鹅集团(Penguin Group USA)、兰登书屋(Random House)、麦克米伦出版社(Macmillan)、剑桥大学出版社(Cambridge University Press)、牛津大学出版社(Oxford University Press)等,资源商如OverDrive、LibreDigital、Ingram Digital、Elsevier、 EBSCO等。在EPUB推出的第二年(2008),全球 EPUB电子书的全年销售额就达到了1.13亿美元[2]。2009年8月,Google宣布用户可以免费下载100万本 EPUB格式的进入公共领域的电子书,这对EPUB标准的推广起到了重要作用[3]。著名的数字资源商OverDrive运用EPUB标准成功将电子资源推向多种终端,建立了OverDrive数字图书馆系统,读者在桌面电脑和手持终端上安装OverDrive Media ConsoIe应用程序,就可以从购置了OverDrive资源的图书馆下载音频书和电子书,程序可兼容包括桌面系统如Windows、Mac与移动系统如Android、BlackBerry、Windows Mobile、iOS等多种系统[4]。国内较早大规模采用EPUB标准的电子书网站是掌上书苑,掌上书苑是针对手机阅读的网站,该网站还推出了专门的阅读软件即EPUB Reader。
2 我国数字图书馆采用EPUB标准的意义
EPUB作为数字资源的国际标准,其重要性不言而喻。我国数字图书馆采用EPUB标准具有双重意义:一是标准化层面的意义,二是EPUB标准自身功能对我国数字图书馆建设的意义。
2.1 基于标准化的分析
(1)节约资源。EPUB标准最突出的特点就是它的开放性和免费性。资源商采用EPUB标准,可以节约格式开发成本和维护成本;图书馆购置以标准格式建设的数字资源,可以避免重复购置。如果资源格式不同,为了满足不同用户的需求,如持有不同品牌阅读器的用户,对于同一资源图书馆往往要购置多个版本。2011年,亚马逊将资源开放给图书馆,由于亚马逊电子书采用的是私有格式,其阅读器Kindle无法阅读EPUB电子书,因此,为满足不同读者的需求,图书馆要重复购买同一资源。从用户的角度讲,则不需要下载多个阅读软件或购置多款阅读硬件,既节约了计算资源,也减轻了经济负担。
(2)提高数字产品的技术层次。在制定标准时,标准组织往往要投入大量的人力和物力,邀请各方面的专家,并经过严格的制定程序,特别是国际组织制定的标准,大都具有全球领先性和广泛的适用性。 EPUB 3.0的工作团队有170多名成员,代表的领域非常广,包括:所有类型的出版商、电子书设备制造商、电子书分发与传播商、来自世界知名公司的技术专家、来自标准组织如DAISY、NISO、EDITEUR、 BISG与IDEAlliance等的代表,以及其他特邀专家如图书馆员、服务供应商及任何感兴趣的机构,所有的开发工作都是以一种公开、透明的方式进行,力求避免私有化倾向[6]。我国数字图书馆采用国际标准,可以有效提升产品的技术层次,充分利用凝结在国际标准中的最佳实践。
(3)有利于资源的长期保存。当新的资源格式不能兼容旧的格式时,以旧格式建设的资源就面临着无法被利用的风险,这对以私有格式建设的资源是一个很现实的问题。但如果采用标准化格式,因格式改变而引发的资源保存风险将被降低,因为标准化组织在格式升级或开发新格式时,大都会提供一个迁移机制,资源拥有者可以将资源安全地升级或转换到新的格式。目前,已有许多EPUB资源格式转换工具,部分可以免费从网上下载。
(4)有利于我国数字图书馆与国际社会接轨。我国与国外,特别是发达国家之间存在着资源流动的不平衡,除了语言问题外,技术标准不一致是一个不容忽视的因素。采用国际社会广泛接受的资源标准,有利于我国数字图书馆与国际社会接轨,提高我国数字资源的“输出”能力,促进中华文明与我同学者的学术成果更好地为国际社会所认识。
(5)为用户提供良好的使用体验。如果资源格式不一致,用户在阅读不同来源的数字产品时,需要使用不同的阅读软件或硬件,而不同阅读软件或硬件有不同的操作方式,用户要多次学习和记忆,并在多种模式间转换,由此增加用户的心理负担。采用标准化的资源格式,用户只要掌握了一种阅读软件或硬件的操作,就能够利用多种资源,有利于提高用户的满意度。
2.2 基于功能的分析
作为一种新的资源标准,EPUB吸收了众多已有格式的优点,并具备了独特的功能,适应了数字资源的未来发展。
(1)有利于数字图书馆开展移动服务。近年来,移动阅读发展迅速。利用阅读器、平板电脑和手机等移动终端,用户可以随时随地获取和使用数字资源。移动终端的类型众多,型号不一,平台各异,现有资源格式(包括通用格式与私有格式)大多是针对桌面环境建立的,不符合移动终端的特点,如在屏幕尺寸较小或用户对文字进行放大操作后,PDF文件经常会“溢”出屏幕,不方便阅读。EPUB正是基于移动环境建立的格式标准,如上文所示,EPUB文档会随着显示设备的不同对内容进行自动调整(Reflowable)和优化,使传统资源格式在移动阅读终端中面临的问题迎刃而解。
(2)适应电子书的发展趋势。随着技术的进步,电子书的内容、形式等都发生了一系列变化,突破了线性阅读的模式,融入了音、视频与网络、交互等众多元素,这种电子书在国外被称为Enhanced Books或 Interactive Books。2010年,美国前总统布什的传记《决策时刻(Decision Points)》发行,除精装本外,《决策时刻》同时推出了两款电子书——标准版与豪华版,豪华版电子书提供了各种互动链接,内容包括视频、演讲全文、手书信件及精装本中没有的50幅照片[7]。EPUB 3.0提供了丰富的编辑和内容展示功能,能满足新型电子书的要求,如每一个EPUB出版物都含有一个或多个EPUB Content Documents,这些 XHTML或SVG文档描述了出版物的可读内容和相关参考资源,如图片、音频和视频剪辑等,新增加的 EPUB Media Overlays 3.0可使文本和音频同步播放。
(3)便于建立灵活的管理制度。EPUB标准没有规定采用何种DRM系统,出版商、资源商和图书馆可以根据自己的需要,自行选择DRM方案,实施灵活的管理制度。自EPUB推出以来,已经发展出了多种授权和使用模式,如非线性外借、需求驱动的采购等。非线性外借(Nonlinear Lending)允许图书馆为每本电子书购买有限次的使用量,如一年使用325次,超过325次则要重新购买;需求驱动的采购(Demand Driven Acquisition)指图书馆在OPAC中提供出版商的所有电子书书目,尽管图书馆可能只购买了其中一部分,如果一本未购电子书被打开并持续了5分钟以上,该书就自动进入图书馆的订购单;其他模式还包括分章节销售、虚拟课程包、短期出租(使用付费)等[8]。
3 EPUB标准在我国数字图书馆推广的障碍
标准化是否能够成功,时机的把握非常重要。如果太早实施标准化,人们就可能被禁锢在不成熟的技术中,或是标准化时设立的一些规则不实用,甚至会导致操作中出现差错;如果太晚实施标准化,则很难达成一套国际标准,因为各方都坚持自己的做法,如果人们已经习惯了某种技术,要想改变,则要耗费巨额资金。EPUB标准在我国的推广即存在实施过晚的弊病。经过近20年的发展,我国数字图书馆拥有了海量的资源积累,各个资源商形成了自己的资源和系统特色。但是,这些资源的格式基本上都是私有格式,资源商在格式的研发上投入大量的人力和物力,并且每年还要投入相当的成本对格式进行维护,如果放弃已有格式而采用通用格式,将会使其投资付诸东流,而且海量的格式转换所引发的成本也是难以承受的。目前,国内部分资源商正努力推广自己的格式,力争将其作为国内的行业标准。因此,采用国际标准的做法在我国可能会引起一些资源商的抵制。同时,电子书标准属于技术标准,如果直接采用有可能陷入类似DVD的专利陷阱,据研究,如果要与国际标准 PDF格式兼容,中国企业每年要付出大量的人力和物力[9]。EPUB标准中是否存在专利,是否含有其他对我国不利的因素,还有待进一步研究确定。
EPUB本身的不完善也阻碍了该标准在我国的推广。例如,EPUB对于需要精确展示或特殊格式的出版物并不适宜;不支持MathML格式的方程式使其不适合大多数的技术出版物;缺少具体DRM方案会影响EPUB对不同设备上DRM系统的支持能力,从而影响了电子书的便携性;由于采用压缩格式,EPUB标准不利于EPUB图书内外链接的建立;缺乏对注解的具体标准。以DRM为例,增加了DRM的电子书只有利用经过购买者授权且与相应DRM系统兼容的设备才能打开,即使开放标准EPUB格式也可能出现被锁定的现象。例如,对于部分“互联网档案”(Internet Archive)中的电子书,申请者需要得到来自 NLS的某种“钥匙”才能利用。由于不同经销商所使用的DRM系统互不兼容,从不同来源购买的电子书即使使用了相同的格式,在同一设备上也未必都能打开[10]。
4 我国数字图书馆采用EPUB标准的对策
我国数字图书馆要积极借鉴国际社会的最新理论和技术成果,但也要结合国内实际,实施科学有效的发展策略,既要避免强行向国际标准靠拢而造成的浪费,也要避免标准滞后,导致阻碍数字图书馆事业的发展。
4.1 重视采标工作
根据《标准化“十一五”发展规划》,我国应采取有力措施,加快采用国际标准和国外先进标准的步伐,着力推动采标政策的落实。应鼓励我国出版界、数字资源界积极吸收国外先进标准、指南或技术报告,使我国数字图书馆建设水平达到国际水平,提高我国数字图书馆在国际同业中的竞争力。国家应组织专门力量深入研究,以便确认有关标准是否含有对我国不利的因素,研究在标准采纳中存在的技术、经济和社会等方面带有共性的问题,为企业实现向国际标准的平稳过渡提供建议和支持。
4.2 制定合理的采标策略
采标工作不宜实行一刀切,不同机构应根据本机构的特点,制定合理的采标策略。
(1)完全采纳。完全采纳EPUB标准是一种比较彻底的做法:数字图书馆放弃现有标准,所有资源使用EPUB格式,已建成资源全部进行转换和迁移。完全采纳的做法适用于新建或刚刚建设的数字资源,建设者因为格式迁移而投入的成本较小,或者是那些已经拥有了一定的资源量,但原有资源采用的是通用格式的数字资源,由于存在比较成熟的转换工具,因而迁移成本亦可接受。
(2)技术改造。国内许多数字资源使用的都是私有格式,且已经拥有了海量资源积累,对于这部分资源,完全采纳EPUB标准不太现实,比较可行的做法是充分利用EPUB标准的开放性和免费的特点,对原有标准和阅读系统进行技术改造,使其与国际标准相互兼容,或具备国际标准的部分或全部功能。
(3)替代策略。如果资源商不愿意放弃原有格式,但又希望利用新格式,可以采取替代策略,即在继续提供原有格式资源的基础上,同时提供采用了EPUB标准的资源,由用户自行选择。例如中国学术期刊即采用了这种做法,用户可以同时下载CNKI自有格式.CAJ的资源和国际标准格式.PDF的资源。
4.3 参与国际标准的制定
在EPUB标准的制定过程中,日本的索尼公司表现得非常积极,其意图无非是使制定出来的国际标准满足该公司在未来数字出版领域的需求,为争取市场主导权奠定基础。EPUB标准虽然经过了三个版本,但仍然有许多问题有待解决,国内出版界和资源商应加强对有关问题的研究,采取跨越式发展策略,积极参与国际标准制定,及时反映我国数字资源界的诉求。目前,我国数字冈书馆对整个产业的发展动态缺乏充分了解,使数字图书馆建设水平与国外先进水平仍有一定差距。积极参加国际标准的制定,既有利于我国数字图书馆参与国际竞争,又有利于我国数字图书馆自身的发展。
是否采用国际标准,以及如何采用,并非一两家出版机构和资源商就能够决定的,与标准化本身的含义一样,采标工作应该是一个集体行为,建议由政府或专业学会牵头,组织各产业相关者,包括出版商、资源商、网络运营商、软件商、硬件商、图书馆等,研究一个能被各方都接受的标准化方案,避免因利益分配不均而导致的恶性竞争。