云出版是解决数字出版面临问题的根本出路,本文主要内容关键词为:出路论文,数字论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
一、数字出版面临的问题
数字出版是当前新闻出版业发展的重点,数字出版的核心思想是利用现代化技术方便内容资源的生产加工,实现出版内容资源的集成共享与知识的复用,达到多源发布,多媒体呈现的目的,使数字出版更容易实现不同的销售和服务形式,创造丰富的赢利模式。
我国数字出版经过“十一五”的飞速发展,已经实现了大量内容资源从纸质出版物向数字化形式的转换。各个出版社和相关企业纷纷建立自己的数据库,并通过自身的网站建设实现数字化产品的推广和传播。同时,在数字化转型的过程中,我国现有的数字出版面临着种种问题,阻碍了数字内容的集成、共享和复用,影响了数字出版市场的进一步发展。
当前,我国数字出版产业主要面临以下问题:
1.内容资源分散,难以形成规模效应,产业难以做大做强
近年来我国在数字出版产业领域取得了较快的发展,但是无论与我国文化市场的巨大市场需求相比,还是与国外大型的出版集团相比,我国的数字出版产业都还处在初级阶段,产业规模小,资源分散。
在进行数字化转型的过程中,出版社纷纷建立自己的内容资源数据库,再通过自己的网站发布数字内容。出版社不愿意将自己的内容交给技术公司处理,也不愿意与其他单位进行内容共享,造成我国出版产业各自为政,企业规模较小,内容集成非常困难,数字出版产业难以做大做强。
2.各类相似系统的重复建设,浪费了大量资源
当前,各地在积极发展数字出版产业,一些具有相似功能的系统都在建设,包括内容生产、编纂加工、集成转换、内容发布系统等。同时,各地也都关注数字出版公共服务平台,国内多个数字出版基地也都在进行公共服务平台的规划和建设。
首先,这些系统功能基本相似,浪费了大量人力物力,没有必要进行重复建设。
其次,系统的多样性会造成所使用的内容标准的多样性,内容资源的共享和互操作更加困难。
最后,随着数字出版产业的发展,系统需要阶段性地进行升级甚至重建,各自为政的进行系统建设,不利于功能的创新和各种标准的推广应用。
3.各个企业的内容标准和发布格式不统一,资源的共享非常困难
我国数字出版产业标准建设滞后,现有的数字出版企业使用的内容标准不同,有的企业使用自己制定的标准,有的企业直接引入国外内容标准,使得内容的共享非常困难,无法实现针对不同来源内容的集成和互操作。
同时,基于不同内容标准的发布格式也是多种多样。以电子书为例,不同的终端厂家支持不同的电子书格式,资源集成困难,电子书阅读器的使用者能够获取的内容资源有限,严重制约了我国电子书市场的发展。
4.各企业数字化转型中数据存储格式和粒度不规范,难以实现知识复用
传统出版在向数字出版转型过程中,海量的纸质内容需要进行数字化处理,形成内容资源数据库。作为数字出版的基础工作,不同企业在进行数字化转型的过程中使用的存储格式和数据粒度不同,难以进行内容的复用开发。
内容存储的格式非常多,包括pdf、doc、txt、xml等公共格式,也包括不同企业自己制定的格式。不同的存储格式使得全文检索和语义处理等操作需要考虑多种格式的索引和查询处理方法。
在存储粒度方面,包括以册、本为单位进行存储,或采用章节、段落、句子等不同存储单位。内容重组和知识复用需要重新对内容进行碎片化的加工处理,面对海量数据需要大量的人力物力。
二、基于云出版的解决数字出版面临问题的对策
云计算技术是新兴的分布、并行的集群计算技术,其思想是通过分解任务到不同的计算机执行,再将执行结果进行汇总,实现通过普通电脑的集群计算达到强大的运算能力。作为IT界的研究热点,云计算已被国内外的众多企业作为重要的战略发展目标,各种应用开发层出不穷。未来几年内,中国乃至全球的云计算技术和平台必将取得长足发展,在各个行业获得普及和应用。
在云计算推动下的出版行业也将获得巨大发展,云计算的强大计算能力,分布式数据管理能力,高度可扩展性和按需服务的特点能够很好地解决我国当前出版行业内容资源分散、应用层次低、内容复用困难等问题,有效地推动数字出版从在线出版向深层次的内容应用和高度的共享集成发展。
当前,国内外的企业都着力进行“云出版”的研发,即研究云计算技术支持下的新闻出版业新的应用,解决以上数字出版产业中的问题。如表1所示,谷歌和盛大全力打造基于云计算的数字图书馆;亚马逊构造基础的云计算出版服务,并通过网络服务的形式进行推广;方正不但在番薯网上构造云阅读平台,而且在印刷行业中通过云计算实现复杂的参数计算。
以上是一些企业在云出版技术上的初探,而要真正发挥云出版计算的优势,打造更多的应用,还需要在以下几个方面进行深入的研究和探索。
1.转换运营模式
数字出版的运营模式从相关网站、软件的自主研发和应用向web服务转变。随着3G网络,乃至4G网络的发展,数字出版的各种应用逐步采用web服务的形式,通过web服务发布云计算的功能,形成“连接网络,获取应用,云端计算”的操作模式。配合各种无线移动终端的普及,形成后台是强大的云计算平台,前端是不同发布和展示模式的移动应用。
Web服务的运营模式,一方面使得系统的部署更加方便,推广更加容易,用户在任何地方,通过任何终端接入互联网,就能够使用相应的数字出版服务,提高了应用的实时性和方便性。另一方面,数字出版公共服务平台等系统可以实现一次建设,网络共享,不必重复建设相同的系统,节省大量资源,并方便统一部署和规划,推广使用统一的内容标准、存储格式、存储粒度,实现不同系统的功能互补和配合使用,方便分布式资源的集成共享。
以数字出版内容监管系统为例,当前新闻出版总署和各地新闻出版局都在进行监管系统的建设,这些系统都实时在进行网上出版内容的扫描和抓取,系统功能上存在重复建设,出版内容存在重复抓取。而通过建立统一的内容扫描和抓取功能,并以web服务进行发布,全国对出版内容可以实现“统一抓取,内容共享”,减少了平台的重复建设。
2.深化技术应用
应用云计算技术能够提供高效的计算能力,在海量数据加工处理方面比传统的应用具有明显的优势,能为深入加工和使用数字出版内容提供有力的技术保障。
现有的集中式数据处理方式不能满足海量数据的加工需要,几百GB甚至TB的数据加工和分析需要以天为基本的加工时间,几百GB的数据甚至需要数周的时间进行数据分析,这对于数字出版的应用推广和服务效果都会产生很大的滞后影响。
围绕数字出版的应用,需要研发基于云计算的分布式数据加工方法,实现包括:数据集成、格式转换、数据编辑、校对审核以及数据发布等功能的高效处理技术,在较短的时间内完成海量数据的分析处理,有效地提高数字出版的应用效率。以数据格式转换为例,传统的集中式处理技术需要数周转换海量的文档,而通过应用基于云计算技术的分布式格式转换,可以在几小时,甚至几分钟完成海量格式的转换和加工处理,极大地提高了工作效率。
3.加强服务创新
数字出版的深入发展需要进一步加强服务创新。随着多种终端的普及,数字出版在已有基础上向多元化、个性化、全媒体、互动性发展,体现以用户为中心的个性化服务,让用户在任何地点、任何时间、通过任何方式获得信息及相关的服务。
服务创新的基础是针对内容和用户行为的深度挖掘,通过海量的数据分析,更加准确地预测用户兴趣,主动向用户推送其感兴趣的产品和增值服务。深化和加强服务的过程是市场不断细分的过程。仅以日韩等国的移动出版为例,其细分市场根据年龄依据已达到每隔3~5岁年龄段就推出不同的数字出版服务和营销策略。
我国数字出版市场同样需要用户行为的多方采集、用户兴趣和内容特征的深入挖掘,以及根据年龄、职业、教育背景等因素的市场细分。加强服务创新需要研发云计算架构上的分布式信息采集、数据挖掘和多元发布等技术,并在此基础上建立细分市场,为不同的用户提供需要的服务,丰富和拓宽多种赢利模式。
4.促进多方集成
云计算的分布式数据集成能力为出版行业带来新的商业模式。包括面向内容资源的集成共享,针对产业链的优化整合,涵盖不同销售渠道的互通公用,汇聚各个企业的交流合作,以及综合各种服务和技术的扩展应用。
以电子书产业为例,当前文档格式多样,阅读终端多样,而且不同文档格式都有对应的阅读软件和处理技术,资源共享和终端服务的发展受到制约。通过建立基于云出版技术的电子书集成应用加工平台,可以促进多种格式标准的互操作发展,为用户提供更多的书籍资源,减少产业链中不必要的中间转换和额外的加工处理,为用户提供更多,更好的服务,利于做大做强电子书市场。
技术的集成和资源的共享会促进产业链的优化,打破妨碍产业发展的壁垒,逐步形成不同的产业集成汇聚点,促进数字出版的规模化和健康发展,推动我国数字出版产业做大做强。
三、结语
我国数字出版经过多年的发展,正在从传统转型和基本应用向内容深度复用、建立市场细分和全媒体展现形式发展。基于云计算数字出版技术能为数字出版的进一步发展提供强有力的方法支持和技术保障。在此基础上,数字出版的运营形式、服务方式和赢利模式都将会逐步实现个性化、多元化和全媒体化,极大地促进数字出版的全面发展。