数据驱动出版:基于大数据的传统出版模式变革研究,本文主要内容关键词为:数据论文,传统论文,模式论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
2012年美国政府发布《大数据研发倡议》,这一举措使得大数据(Big Data)成为2012年最热门的名词。事实上,“大数据”这个概念并不是近年才出现的,早在20世纪80年代就有美国学者提出。20多年来,随着各领域数据量的爆炸式增长,这个名词开始受到越来越多的关注,并成为众多国家、政府、产业和企业的发展战略。大数据并非一个确切的概念,最初,这个概念是指需要处理的信息量过大,已经超出了一般电脑在处理数据时所能使用的内存量。[1]目前,其强调的是在多样或大量数据中快速收集数据并对这些数据进行有效分析的能力。大数据引发信息技术(Information Technology)变革的重点由“T”(技术)逐渐转向“I”(信息),必然也将会对以“信息”为主要工作对象的出版业形成直接而巨大的冲击。 一、大数据环境下我国传统出版产业面临的困境 在大数据的环境下,我国传统出版产业面临着诸多困境。图书库存居高不下、图书供给结构性矛盾的产生,这些都与出版数据的缺失有关。此外,未能充分理解出版数据的价值,缺乏真正的数字化思维,也使得我国出版业数字化转型面临着诸多障碍。 1.出版信息交流和共享缺失使得图书库存量居高不下 目前,我国既未建立真正的全国性的图书发行平台,也没有覆盖全国的图书发行数据、监测机构,新华书店、网络书店、民营书店这三类图书发行渠道中,尽管前面两种的销售库存信息都已做到准确和及时,但新华书店系统的地区壁垒很高,各省新华书店之间未能做到信息共享,网络书店系统更是竞争激烈,缺乏基本的信息交流,民营书店的销售信息,尤其是占据民营书店主体的中小书店的销售信息则更是无从获取。销售、库存信息的缺乏使得出版社无法准确地预测市场需求、确定图书印数,往往只能凭借经验甚至靠“猜”,这种感性的决策方式往往又容易放大读者需求,造成大量无谓的库存图书。原新闻出版总署的统计数字显示,2012年全国新华书店系统、出版社自办发行单位纯销售67.69亿册(张、份、盒)、688.48亿元,与上年相比数量增长2.90%,金额增长5.34%。其年末库存总量与销售总量相比,仅少了6.47亿册(张、份、盒),达到61.22亿册(张、份、盒),金额甚至远远高于销售额,达到880.94亿元,库存增长率更是远远高于销售增长率,与上年相比数量增长9.60%,金额增长9.56%。[2]我国图书库存量居高不下在很大程度上是由于出版行业缺乏信息交流和共享造成的。 2.读者需求预测失效引发图书供给结构性矛盾 2013年我国图书出版品种达到44.4万种,我国已经成为当之无愧的出版大国。[3]然而,与图书出版品种的增长不符的是,我国国民阅读情况却有些不尽如人意。根据中国出版科学研究所发布的《第十一次全国国民阅读调查》显示,2013年,我国18~70周岁国民图书阅读率却仅有57.8%,人均纸质图书阅读量也仅为4.77本,比2012年下降了0.02本,52.8%的国民都认为自己的阅读数量很少或比较少。[4]人均纸质图书阅读量的下降一方面是受数字化阅读方式日益流行的影响,另一方面,也有很多读者表示尽管市场上销售的图书品种很多,但是能够引起阅读兴趣的书却非常少。这表明,我国图书供给与需求不相匹配,产生了结构性矛盾。而读者需求预测失效是产生这种现象的最为直接的原因。准确的读者需求预测是出版产业供应链运转的基础,其能保证供应链以最快的速度为读者提供最佳的服务。但实际上,由于图书出版产业客观环境的复杂性和认识能力的局限性,读者需求预测本身带有明显的不确定性。一方面,与其他产业不同,图书出版行业全新产品所占比例非常高,例如2013年我国出版的图书中,新版图书有25.6万种,占到57.66%,[5]这就增加了需求预测的难度,使得出版企业很难基于过去的经验判断市场需求。另一方面,我国出版业的退货政策也是造成读者需求预测失效的重要原因。我国图书出版业长期由出版社单方面承担退货成本,这就使得图书分销商的退货成本远远低于销售利润,所以分销商很容易放大图书市场需求,超量采购,这也就造成了读者需求预测的困难。当然,还有出版社和读者直接沟通渠道的匮乏也使得我们很难真正准确了解和预测读者需求。读者需求预测的困难和频繁失效,引发图书供给结构性矛盾,既无法充分满足读者的阅读需求,又无法实现出版社的经济和社会效益。 3.数字化思维缺乏导致出版业数字化转型遇困 尽管数字浪潮席卷出版业已有多年,但我国传统出版社和出版人至今仍未真正建立数字出版思维,在选题策划和组稿阶段未能充分利用数字阅读平台和软件以及社交网络所提供的读者需求偏好和读者阅读行为方面的数据;在编辑出版纸质图书的过程中也未能自觉考虑到后续的向数字出版延伸的问题,建立并保存一份易于转换为内容一致的电子书的数据源;在销售电子图书的过程中未能与销售商以及其他出版社之间建立深度战略合作关系,共享读者数据,实行精准营销。数字化思维的缺乏也使得我国出版业虽然早已开启数字出版项目,却将大量的人力、物力和财力投入到数字出版的基础建设中,因此时至今日,仍然处于初步探索阶段,尚未走出一条适合自己的数字化转型发展道路。 二、大数据对传统出版模式的变革 大数据技术将会以数据驱动出版的形式对传统出版模式产生变革。这场变革深刻而剧烈,涉及传统出版的整个流程,从图书生产到图书销售,再到图书营销,进而推动我国传统出版产业的数字化转型。 1.用户行为数据而非编辑经验主导图书生产 作为文化发展趋向和出版市场需求的“把关人”,编辑过去一直是图书生产的中心,编辑环节也是图书生产的核心环节。编辑通过调研了解市场需求,结合社会的文化导向发现选题,再经过严格的论证和审核流程,确定选题、进行组稿。完成这一套流程,不仅会花费较长时间和精力,而且,效果还经常不尽如人意。如前所述,我国图书市场存在的供给结构性矛盾就是例证。事实上,在传统图书生产环节中,尽管有调研环节,姑且不论这种调研方法多采用的是随机抽样问卷调查和访问的方法,抽取的这些样本是否科学,问卷设计是否合理,能否真正代表广大读者的真实需求,大多数图书选题的产生甚至没有经过真正意义上的市场调研,完全基于编辑的感性经验。因此,一直以来,出版业也被许多人视为一个强调艺术追求、专业经验而缺乏科学实证的行业。[6]大数据则可以改变这种现状。首先,其将理性的决策工具和方法引入图书生产的核心环节,以用户行为数据整合与分析为基础指导图书生产。例如编辑可以基于社交网站、搜索引擎、电子阅读平台以及个性化阅读应用搜集海量读者行为数据,在这些海量数据中挖掘出关于读者阅读偏好的数据集,包括喜欢搜索哪种类型的图书内容,喜欢哪些作者,喜欢哪个平台等,把这几者结合起来,就会产生一项甚至一系列理性的选题决策。其次,大数据还会对组稿环节产生影响。过去,当编辑向作者提供某些建议的时候,总是因为没有足够的证据去支持自己的判断和建议而无法得到作者的认可。在大数据技术的支持下,编辑可以以数据为基础向作者提供建议。例如其可以基于图书评论数据,向作者展示其他作者引起书迷不满的原因,我们的作者想要建立并保持相关读者群对自己的品牌忠诚度,有哪些需要避免和加强的部分,以更加科学的方式提出相关建议,建立更加融洽的作者关系。再次,除了组稿环节,印数的确定也非常重要。通常出版业的核心价值是为了满足人们的精神需求,而精神需求一直是非常难以量化的,因此,这也成为一项非常苦难的工作。在大数据技术的帮助下,编辑则可以通过收集相关内容图书的销量、库存、读者分布、读者评论等数据集并加以分析,发现市场的真实需求,从而便于更准确地确定图书印数,避免图书库存和资源浪费。 2.全国性发行平台而非分散渠道整合图书销售 大数据对图书发行环节的影响就更为深远了。我国因为缺乏全国性的图书发行平台,长期存在图书销售数据不明的情况。出版社主要依赖于分销商的报告。例如通过新华书店和网络书店的相关销售信息以及某些商业媒体的畅销书排行榜来获取销售信息。且不论我国出版业的“买榜”现象非常普遍,数据真实性堪忧,即使这些数据都是真实的,出版社也只能获得自身生产的图书的相关销售信息,无法了解竞争对手或其他同类图书的市场销售数据。要取得商业成功,了解相关竞争对手以及整个行业的发展情况至关重要。当然,如果一个出版社对某一本书特别感兴趣或者很关心一本书的销售情况,它可以通过其区域发行人员对这本书的销售全程进行跟踪调查。然而,这些发行人员通常只能获取这个地区的少数书店的销售信息,而且,要获得真实的信息,发行人员通常要去做实地调查,这就意味着需要花费大量的时间出版社才能最终获得这些数据反馈。图书本身是一种生命周期非常短的商品,这些也许已经失去了时效性的销售数据很难让出版社真正准确了解全国性的图书销售情况。大数据技术则可以改变这一现状,基于大数据技术建立的全国性图书发行平台具备图书销售数据整合与分析职能,可以让出版社实时了解到全国图书发行情况。民营出版商“新经典文化”就基于大数据技术,开启了“私有云”平台建设项目,在“云”上建立提供出版信息服务和物流服务的全国出版发行网络平台,以改变图书发行信息不透明的现状,项目总投资大约需要10亿~15亿元,目前已经获得国际风险投资巨头红杉资本1.5亿元的投资,这也是迄今为止民营书业获得的最大单笔投资。“私有云”平台建立起来后,将不仅承担收集、整理图书销售数据这样的基础性工作,而且还要利用数据可视化的技术将海量销售数据中隐藏的有价值的知识揭示、展现出来,不仅有助于出版社全面了解图书销售信息,而且还能帮助其更加准确地预测图书市场需求。 3.“需求”而非“供应”或“直觉”驱动图书营销 过去,出版社直面的是销售渠道,以B2B(Business to Business,企业到企业)的商业模式运行。因此,出版社的营销多基于“供应”驱动,大量的诸如作者签售、渠道推广等营销活动旨在吸引销售渠道,向其供应更多的图书。随着数字出版和网络传播技术的发展,出版社开始直面读者而不是企业,传统的以“供应”驱动图书营销的方法逐渐不再适用。然而,“直觉”又逐渐成为了出版社营销活动方案的驱动因素。因为缺乏图书营销效果监测工具,传统出版社经常采用的作者见面会、媒体访问、广告、价格促销等营销。策略耗费了大量的成本,可是对于这些营销活动是否真的对图书销售起到了作用,或者其中哪一项活动促进了图书销售,哪一项活动毫无价值,出版社却知之甚少。在大数据技术的帮助下,出版社则可以很清楚地监测其开展的营销活动的效果,迅速取消那些没有价值的营销活动,转而策划更有效的营销活动。美国出版巨头哈伯·柯林斯(Harper Collins)就积极利用大数据技术,挖掘读者需求,科学制定图书营销方案。2013年,哈伯·柯林斯的数字出版部门专门成立了数据部门。其数据部门基于其自有的数据库和图书销售平台,采用大数据技术获取其消费者数据,包括一手和二手数据,整合和聚集数字销售和定价的相关数据集,并初步尝试通过数据分析和可视化技术向其员工提供数字销售影响因素以及需求弹性的可视化数据分析报告,帮助其员工发现图书营销中哪些因素在发挥作用,分享成功的图书营销实践。目前其已经开始将分析结果综合运用到市场战略和定价战略中,解释为什么品牌X、图书X或系列Y未能获得成功。当然,目前哈伯·柯林斯对大数据技术的应用还在起步阶段,非常遗憾的是它只是事后分析,目前尚未能真正起到预测的作用,但是它仍然有效,并且可以对其下一图书项目营销活动的策划提供一些参考。[7]除了哈伯·柯林斯,美国还产生了专业的出版数据挖掘公司,例如图书观察者(Bookseer)、封面蛋糕(Covercake)等,这两家公司目前在出版大数据方面的实践也主要集中于图书营销领域,主要是基于社会媒体的用户阅读行为和图书评论进行的图书营销效果的追踪和利用,前者目前还获得了兰登书屋(Random House)、阿歇特(Hachette)、哈伯·柯林斯和企鹅(Penguin)的投资。[8] 4.知识而非技术推进我国出版产业的数字化转型 过去,我们谈到出版业的数字化转型的时候,一直在强调技术的推动作用。柳斌杰提出要“运用高新技术和先进设备改造传统基础设施”,“积极采用数字、网络等高新技术和现代化生产方式,改造传统创作、生产和传播模式,建立新型内容生产方式和数字化传播载体、传播渠道”,“以新技术新业态提升出版业的核心竞争力和整体实力”。[9]大数据技术则是以技术为手段,以知识的提纯、重组和有效利用为内核,推动我国出版产业的数字化转型向知识驱动的方向持续演进。在大数据的影响下,出版产业将会改变以往依托于数字出版技术,以书、文献的数字化生产和传播为发展方向的数字化发展路径,转而形成以知识要素为单位,通过对出版内容和读者需求数据的深入了解,将内容分化为一个个高度浓缩的知识要素,并将其与读者的知识需求紧密结合,[10]实现专属内容智能定制和精准推送。这并不是由计算机制定决策,而是由知识驱动的、人类与机器协作制定出版决策,推动出版产业向知识服务型转变的数字化转型模式。 三、结语 大数据与出版业有着天然的联系,其无疑将会对传统出版业产生深刻影响。然而,我们在迎接大数据技术的时候,也要看到很多现实困难。首先,大数据是出版产业数字化转型的重要推动力。但是与此同时,数字化又是出版产业应用大数据的基础,没有出版产业的数字化,内容、读者需求、读者阅读行为、读者评论、销售、营销服务的数据化就无从谈起,大数据技术在出版产业的应用也就无从谈起。其次,数据获取的问题。虽然我国传统出版企业中,很多都在建立数字阅读平台,开发数字阅读设备和软件,但是其用户数量仍然较少,亚马逊中国、当当网、京东商城这些电子书平台以及生产数字阅读终端的苹果公司才掌握着最多的读者数据。如何从这些企业获取数据,这也是一个相当大的难题。最后,我国传统出版社很少拥有大数据和高度结构化数据形成的数据集。与其他行业相比,出版社作为内容提供商,其在数据驱动决策方面并没有什么优势。出版内容,也就是俗称的创意并不是大数据,它更容易被描述,而不是被分析。因此,在出版业热烈拥抱大数据时代的到来时,也要注意解决以上这些难题,不要只是炒作“大数据”的概念,而要真正将大数据技术融入出版产业变革中,实现数据驱动出版,推动出版业的转型升级。数据驱动出版:基于大数据的传统出版模式改革研究_大数据营销论文
数据驱动出版:基于大数据的传统出版模式改革研究_大数据营销论文
下载Doc文档