欧美传统出版企业大数据应用策略探析,本文主要内容关键词为:探析论文,策略论文,传统论文,欧美论文,数据论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
随着互联网技术的不断发展,数据已经呈现出爆炸性增长的态势,企业界人士已经越来越意识到数据对于企业决策的重要性,麦肯锡咨询公司发布报告指出大数据时代已经到来。相对我国而言,欧美出版企业在新技术的运用上一直走在前列,在大数据时代到来之际,欧美传统出版企业也看到了大数据技术给出版业带来的新的发展机遇和挑战,并开始探索利用大数据技术挖掘出版业真正的核心价值,建立新的出版商业模式。这些出版企业在应用大数据技术的过程中既有成功的经验,也面临着很多挑战。在这里,笔者拟对欧美传统出版企业大数据应用策略进行描述和分析,希望给大数据时代我国出版业的发展提供一些启示。 一、大众出版企业:联合建立大数据分析平台,促使需求驱动图书营销 与教育出版和专业出版企业不同,大众出版企业面临的读者较为分散,依靠单个企业要获取海量读者数据几乎是一项不可能完成的任务。面对这种情况,欧美大众出版企业加强合作,联合建立大数据分析平台,网络书店书呆网(Bookish.com)就是其合作的产物。 2013年2月,美国著名出版商阿歇特、西蒙·舒斯特和企鹅共同出资建立了一个新的网络书店:书呆网。除了这三家企业,书呆网还包括阿歇特图书出版集团、霍顿·米夫林、哈珀·柯林斯、麦克米伦、兰登书屋等大众出版巨头和编年史书出版社、孤独行星出版社、普林斯顿大学出版社等中型出版企业。[1]书呆网的核心是其图书推荐平台,该平台采用编辑独立的方针,聘请了6名经验丰富的编辑,每天根据不同主题在大量出版企业中挑选优秀的图书和作者,为其撰写书评,并向读者推荐相关好书。书呆网以图书为中心,结合读者的个性化体验,利用机器学习和大数据技术帮助读者找到下一本适合的图书。“机器学习”指的是读者可在个性化推荐页面、新书推荐页面、常销书推荐页面和畅销书推荐页面分别给出的5本不同类型和风格的图书中选择自己最喜欢或最想读的一本,点击该书后,页面就会新增一栏,左边“你的图书”一栏显示挑选的图书,右边“我们的推荐”一栏则是网页基于所选图书的类别、作者和内容新推荐的与该书有关联的4本图书。读者多次选择图书以后,平台就能根据读者提交的信息改善算法,推荐更符合读者要求的书籍。书呆网还将大数据技术应用到图书知识中,试图模仿人们提出建议的方式,收集关于图书的所有描述,包括作者、类别、出版日期、风格等,以及流行的至关重要的评论,利用现代信息技术挖掘出与图书相关的所有重要主题,提供一个强大的功能数据集。[2]目前,书呆网的图书数据库中一共收藏了30余万种图书,横跨18个类别,并且数量每天都在增加,其还内置了与亚马逊、巴诺 & 鲍德斯、苹果iBookstore、库伯(Kobo)等大型图书零售商官网的链接,读者也可以通过这些平台购买图书。[3]因为书呆网建立的时间较晚,因此,其一开始并没有读者的个人数据,直到读者选择图书后,平台将自动根据相关元数据(例如作者、标题、种类等)推荐类似图书。[4]书呆网还聘请了麻省理工学院的毕业生卡伦·桑(Karen Sun)负责监督“万亿计算”,这些都使得书呆网的“大数据”功能逐渐变得更加强大。[5] 书呆网以及美国大众出版商支持建立的其他出版大数据应用平台,例如封面蛋糕(Covercake)等,运作时间都较短,从目前实际运作情况来看,均主要着力于图书营销环节的变革,尚未触及图书内容生产环节。而事实上,这个环节对于将原有的直觉和经验驱动图书生产变革为数据驱动图书生产的需求更加强烈,且目前大数据在图书营销环节的应用也更多倾向于事后分析。因此,欧美大众出版商想要建设足以与亚马逊、苹果、谷歌相抗衡的出版大数据分析平台,未来还有很长的路要走。 二、教育出版企业:基于内容和用户需求数据,开发个性化教学方案和智能学习平台 在数字化浪潮席卷出版业的时候,很多人认为教育出版领域的数字化前景是比较灰暗的,甚至有些大型出版企业出售了教育出版板块,例如里德·爱思唯尔2001年7月才收购哈考特教育,2007年便将其出售给了培生教育出版集团;[6]汤姆森集团也于2007年7月5日以77.5亿美元出售了其一直运行良好的教育出版公司与书籍网络资讯公司,[7]转而与路透合并,成立汤姆森路透集团。然而,随着2013年培生集团以93.33亿美元的收益[8]超越里德·爱思唯尔72.88亿美元的收益,[9]成为世界排名第一的出版集团;圣智学习出版公司在2013年7月宣布破产后,2014年4月甩掉40亿美元债务,完成财务重组,登上2014年全球出版业50强榜单,并获得11名的好成绩,[10]且其数字产品及服务的收益在总收益中的比重均超过50%。我们有理由相信,教育出版业同样有着光明的数字化前景,而且,欧美教育出版企业的数字化转型已经卓有成效。因此,当大数据浪潮席卷到教育出版领域,欧美教育出版企业在已经具备数字化基础的情况下,也开始基于已有的内容和用户需求资源,利用大数据技术,开发个性化教学方案和智能学习平台。 作为世界最大的教育出版集团,培生拥有最为丰富的教育内容资源,因此,其首先将大数据技术运用于内容数据的优化方面。为了满足不同群体的海量知识信息需求,培生教育依托于传统内容资源优势,将海量信息资源数字化,建立起方便读者随时取用的在线信息资源库,并增加附加值服务。集团开发的EQUELLA就是一个专业的教育内容数字在线仓储,该资源库可以方便读者随时随地获取需要的内容,同时还从读者需求的角度出发,提供各种在线内容的搜索、创建和管理等功能。[11]除此以外,2013年4月培生还收购了美国哈佛大学开发的基于云计算的学习分析与管理系统LearningCatalytics,该平台使得教师能够向学生发布开放式的问题,并且实时获得学生提交的答案,帮助教师确定哪些知识领域需要进一步的深入讲解,以便用更早的干预来提高学生的记忆和学习成果,帮助教师更加灵活、便捷地管理学生的学习进度和学习效果。近年来,培生还和多家大学和研究机构合作,积极开发智能学习平台。培生集团还与海洋社区学院、印第安纳州卫斯理大学和罗格斯大学、阿德菲大学、维拉诺瓦大学和马里兰大学等全球200多所大学合作,开发了在线教育平台亚利桑纳州立大学在线、电子大学、温吧网等智能学习平台。这些平台可以对学习者的学习行为自动进行提示和评价。例如通过记录鼠标的点击和光标停留的位置,平台可以记录学习者在某个页面上停留的时间,判断学习者对知识点的掌握情况,从而总结出哪些知识点是教学难点和重点,哪种学习工具在哪种情况下最有效等规律。该平台之所以如此强大,正是因为其有大数据技术做后盾,将混乱的个体学习者的学习行为数据收集起来,当这些数据积累到一定程度时,群体的行为就会在数据上呈现一种秩序和规律,然后有的放矢,对不同的学习者提供有针对性的帮助。[12] 三、专业出版企业:开发分析技术,推动客户数据的智能化和知识数据的可视化 专业出版是欧美出版业中数字化程度最高的部门,这一点可以从欧美各大出版集团2013年的销售数据中得到佐证。六大大众出版集团中,数字化程度最高的兰登书屋,其2013年数字产品收益占总收益的比例仅为24%,[13]最低的阿歇特图书出版集团其数字产品收益甚至仅占总收益的10%;[14]教育出版企业中,数字化程度最高的培生教育出版集团,其2013年数字产品和服务销售额占集团总销售额的58%;[15]专业出版企业中,里德·爱思唯尔、施普林格、自然出版集团、沃尔特斯·克鲁维尔等,其数字化收益占总收益的比重均在60%以上,其中里德·爱思唯尔出版集团的数字产品收益更是占到集团总收益的66%。[16]对于出版业而言,大数据的本质是更为广阔、深入的数字化以及全社会范围内的数据的互联互通。从这个意义上来说,数字化程度最高的欧美专业出版企业在大数据应用方面显然具备更多的优势和能量,事实也正是如此。欧美专业出版企业在大数据应用的路上走得更远,它们利用已有的技术基础和内容优势,积极开发新的大数据技术,推动客户数据的智能化和知识数据的可视化。 里德·爱思唯尔集团旗下的律商联讯就投资开发了高性能计算集群系统(简称HPCC)技术,推动客户数据的智能化。目前HPCC技术已经成为该部门的核心产品,并广泛应用于里德·爱思唯尔开发的各种数字化产品和服务。HPCC系统在其主要产品ScienceDirect(《科学指南》)的运用,帮助其向研究者推荐更多需要的相关文章,有效帮助ScienceDirect增加了65%的点击率。[17]作为目前最先进的大数据处理技术,HPCC技术帮助里德·爱思唯尔集团共享各大细分市场的数据资源及其分析结果,有效实现数据的互联互通,应对数据的海量增长给数据分析带来的挑战。该技术结合成熟的数据处理方法以及里德·爱思唯尔专有的连接算法,推动了客户数据的智能化。除了自己投入巨资开发新的大数据分析技术,里德·爱思唯尔还和一些大学、研究机构开展合作,资助其技术创新。例如2013年12月18日,爱思唯尔、伦敦大学学院(简称UCL)宣布共同建立UCL大数据研究所。UCL的研究范围非常广,近年来,其在大数据的研究分析方面积累了丰富的成果。为了充分认识和实现二者在资源共享方面的协同作用,UCL将访问爱思唯尔的世界级的研究数据和企业技术,为大数据在更广阔的范围内得到应用开辟出新的可能性。里德·爱思唯尔还新近收购了门德里公司(Mendeley),该公司位于东伦敦科技创业园中心,其有一款免费的跨平台文献管理软件和在线学术社交网络平台,向用户提供基于社交网络的学术成果分享和合作服务,可追踪论文引用记录等。施普林格科学与商业媒体集团公司也与伦敦的新创业公司社会媒体指标公司(Altmetric)合作,为其旗下的施普林格(SpringerLink)在线平台上的每篇文章的摘要页中加入衡量研究成果影响力的社会媒体指标信息,对围绕学术文献的线上活动加以追踪和分析,这一方面可以更好更全面地追踪到用户阅读行为数据,另一方面,也可以使用户更容易获得论文的社会媒体影响力信息。 除了将大数据技术用于客户数据智能化,欧美专业出版企业还将其应用于知识数据的可视化。2014年1月30日,泰勒·弗朗西斯就与在线知识分享平台“图表分享”达成合作协议,帮助研究人员安全地建立、发布和分享其研究成果。“图表分享”是专门为研究者、学术研究机构和出版商服务的研究数据管理工具,该平台允许浏览器对任何形式的文件可视化,因此,图表、数据集、媒体报道等各种在传统学术出版模式下不允许传播的内容均可以在这里传播。泰勒·弗朗西斯与在线知识分享平台“图表分享”的合作将会帮助泰勒·弗朗西斯1700多种期刊中不同类型的数据实现可视化,使其期刊论文的补充材料有了新的传播渠道。从此,泰勒·弗朗西斯网络在线平台也可以即时阅读图表、数据集、文件集、视频等期刊论文的补充材料,这些材料还可以被“图表分享”主办的搜索引擎轻松地检索到。这项技术合作可以帮助期刊论文作者使用“图表分享”的技术发布其补充数据,这使得作者不仅可以看到其论文的补充材料,还可以很方便地与其他研究者分享这些材料,并通过“图表分享”的度量函数追踪到用户的使用情况。上传到“图表分享”的每一份文件都很容易被引用,与此同时,“图表分享”上的每一项数据都将链接泰勒·弗朗西斯在线平台相应的文章。这样,研究者不仅更容易发现补充材料,也更容易关注到相应的文章,帮助研究者非常便利地通过搜索引擎找到更加丰富的研究材料,同时也会提高作者及其研究文献的知名度。[18] 四、结语 从欧美传统出版企业大数据应用的案例中可以看到,这些出版企业的数字化程度都非常高。“数字化”是“数据化”的基础,要想将大数据技术有效地应用于我国出版业,出版企业首先要实现数字化转型,否则“大数据”只能成为出版业的陷阱。我国出版企业应当以数字化转型为主要发展方向,同时,建立大数据意识,确定自己的大数据应用需求和目标,制定适合企业发展的大数据应用规划,推动我国出版业的深层次变革。欧美传统出版企业大数据应用策略分析_爱思唯尔论文
欧美传统出版企业大数据应用策略分析_爱思唯尔论文
下载Doc文档