大数据技术在数字出版中的应用前景_大数据论文

大数据技术在数字出版中的应用前景_大数据论文

大数据技术在数字出版中的应用前景展望,本文主要内容关键词为:版中论文,前景论文,数字论文,数据论文,技术论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

大数据(big data),或称巨量资料(通常以P、E甚至Z作为计量单位),指的是所涉及的资料量规模巨大到无法透过传统软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助企业经营决策更积极目的的资讯。随着全球数据爆炸式增长和并行数据库(MPP)等计算机技术的发展,大数据技术(对大数据的收集、分析、使用的相关技术)日渐成为互联网信息技术行业的最炙手可热的技术。而对于以内容为主要价值载体的传统媒体,也不可避免地受到了大数据浪潮的冲击。据统计,2000年数字化储存的信息只占全球数据量的1/4,而到2012年,所有数据中只有7%储存在报纸、书籍等传统媒介上,其余全是数字存储的数据,数据总量却增长了几十倍。

近些年数字出版的迅猛发展,为传统媒体实现数字化转型提供了机遇的同时,也带来了不少困惑。也正是由于数字出版产品的普及,使投身数字出版的传统媒体收集、分析、使用内外环境的海量数据并从中获取价值成为可能。在大数据时代,研究如何将大数据技术应用到数字出版中,对数字出版者盘活数据资产,从而引导和促进数字出版的快速、健康地发展有非常重要的现实意义。

一、大数据技术在数字出版中的典型应用模式

由于数字出版与计算机技术的紧密联系和其传播的特点,大数据技术在数字出版领域的很多方面都有其巨大的应用空间。下面列举未来大数据技术在数字出版中几种典型的应用模式进行分析。

1.精准策划和精准营销

目前出版物(包括纸质出版物和数字出版物)内容的策划,往往是凭借策划编辑的行业经验和对某一领域热点的敏感程度来进行,往往存在对热点把握不到位,目标读者定位不准确,邀请的作者不合适等问题,存在一定的风险。“精确策划”是指通过对主流的社交平台(比如豆瓣网、人人网、微博、微信及专业领域的交流平台等)和电商平台提供的记录用户行为(浏览记录、购买记录、发表的言论等)的海量数据进行分析,筛选出各个领域的当前热点议题作为备选选题,相关的权威或焦点人物作为作者人选,同时对其相关用户的性别、年龄、职业、地理位置等信息进行分析,以准确定位目标读者群和测量市场容量的选题策划方法。这些数据不仅可供策划编辑进行“精准策划”,同时也可提供给专家对选题进行“精准论证”。

“精准营销”是指数字产品生产出来以后,可以利用策划阶段分析出的用户信息进行广告和试用体验的精准投放。例如,可以将电子书的样张通过社交网站或者电商精确推送给对其内容感兴趣的群体;再例如,目前很多出版社都建立了自己的数字资源库,里面存放了大量经过标引的碎片化的数字资源(图片、章节、条目、试题、音频、视频等),将这些资源单独或者灵活组合后通过互联网中的各种渠道推送给感兴趣的用户,不仅可以增值,还可大大增加用户的黏度。而将用户使用这些数字资源的过程记录下来进行分析,又是一笔不小的数据财富。

2.研发和生产过程的优化

数字出版产品的研发过程,由RDM系统进行管理;制作(生产)过程一般由ERP系统和数字化的制作工具管理;供应链由SCM系统管理。如果利用这些系统和把产品研发和生产过程中产生的所有数据进行收集分析,就好比用放大镜把这个过程进行放大出来观察,从中提炼规律并加以利用,对优化流程,提高产品的生产效率和质量有非常重要的意义。其中,协同编纂平台就是大数据技术理想的应用平台。协同编纂平台是为传统出版社构建的可以实时、跨地域地将作者、编辑、专家、数字内容加工和发布人员整合在一起进行数字内容创作、协同编纂、动态发布的一体化作业平台。作者、编辑、专家、加工发布人员利用平台的工作过程以及他们通过平台进行交互的过程中会产生大量的非结构化的数据(比如文稿修改的记录、编辑和专家沟通的记录)。通过对这些数据的分析,可以发现流程中哪些环节是瓶颈环节、编辑哪方面能力欠缺、文稿中出现频率最高的错误等这些非常有价值的信息,从而采取措施应对。

3.用户体验和产品效果的评估

例如,收费电子书可以提供部分章节让读者试读,然后决定是否购买。通过电子书发布平台的大数据的收集工具,出版社不仅能统计电子书的试读和购买次数,还能绘制出“读者图谱”,包括用户的年龄、收入和地理位置等。此外,还能收集读者在看完免费章节后是否进行了购买,读者平均看了多少页,每页的平均驻留时间,以及读者最喜欢从哪个章节开始看,又在哪个章节半途而废等各种有价值的用户体验信息加以分析和评估。

再如一款具有语音交互功能的数字出版App,出版社可以通过iPad的麦克风、摄像头和触摸屏收集用户使用的时间、场景、使用交互功能的次数、用户使用语音交互功能时的录音等数据来分析用户对这个App的喜爱程度、使用后的情绪变化和相关知识的掌握程度等信息,从而来评估这款App是否达到了预定的效果,以便于今后对App的改进。

4.进行数字教育模式的研究和提供个性化数字教育服务

数字出版最重要的方向是数字教育。数字教育的发展趋势是平台化和服务化,要求出版商不仅要提供纸质课本内容的电子版,而且要通过数字教育平台提供一体化的数字教育服务。在这样的数字教育背景下,大数据技术有着广泛的应用空间。

首先,大数据技术可以用于数字教育模式的研究。出版商通过电子书包等产品详细记录课堂内外老师的教学行为轨迹(例如授课时的语言动作、使用的例题等)和学生的学习行为轨迹(例如听课时的反应、电子书包的使用记录、回答问题的记录等),通过对比分析这些数据可以对学习行为和学习效果进行准确的评估,从而遴选出最有效的教学方法和教学工具,归纳出哪些内容学生最难理解需要反复强调,也可以发现数字产品还有哪些不足需要改进,这些累加起来就推动了数字教育模式的整体进步。

其次,大数据技术使为老师和学生提供个性化的数字教育服务成为可能。对于老师,可以通过对老师的教学过程数据的分析,总结出每个老师不同的授课习惯和教学中的优缺点,为其提供个性化的教学方案;对于学生,可以通过综合分析每个学生个体的学习行为记录、努力程度、智力水平、日常行为、家庭背景等这些看似完全不相关的海量数据,对学生的学习情况作出全面、客观、准确的评价。利用这些信息可以为学生量身打造最适合的学习计划和提供针对性的辅导,也可以将数字资源库中已经碎片化的知识点条目、试题、音视频等教育资源根据学生的薄弱环节非常准确地提供给学生,并产生价值。

二、大数据技术在数字出版中应用面临的挑战

虽然大数据技术在数字出版中有着广阔的应用前景,但要真正实现大规模应用,还面临着诸多挑战,主要体现在以下几个方面。

1.大数据收集渠道不畅

高度信息化的数字出版环境是收集海量数据的基础,但目前数字出版大环境中数据的收集渠道仍存在以下问题:(1)社交网站和电商还没有完成向数据提供商的转变,数字出版者实时获取公共网络环境中的海量数据仍很困难;(2)数字出版产品设计、研发、生产和经营全过程没有完全实现信息化管理,无法完整收集这些过程中的数据;(3)高标准带宽和存储设备等基础硬件设施(比如云存储)较少,无法满足大数据的存储和传输;(4)目前数字出版产品或平台大多数不具备记录其使用过程中海量数据的功能。

2.大数据高效分析能力欠缺

实现大数据的高效分析,不仅需要由大量新兴技术(如Hadoop Map Reduce、内存数据库、并行处理等)组成的高性能的专业的分析技术架构解决方案,还需要科学的分析策略和数据分析人才。而这些资源在数字出版领域仍然比较匮乏。

3.决策习惯的改变仍需时日

目前数字出版者的经营管理方式往往是建立在经验或者传统数据粗糙的分析方法基础上的。而改变各层次决策者旧的决策习惯,使其学会利用大数据的分析结果进行决策,仍需一个相当漫长的过程。

三、结语

“得数据者得天下”,这句话同样适用于数字出版领域。如果说云计算为数字出版相关联的海量数据提供了保管、访问的场所和渠道,那么如何运用数据资产,使其为数字出版服务,则是数字出版领域大数据应用的核心议题。虽然目前大数据技术在数字出版中大规模应用的条件还没有完全成熟,但随着高速网络、云计算中心等基础设施的日趋完善和大数据技术的不断发展,数字出版发展的趋势必将是以数据驱动的云出版,因此大数据技术在数字出版领域将扮演越来越重要的角色。

标签:;  

大数据技术在数字出版中的应用前景_大数据论文
下载Doc文档

猜你喜欢